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sondes comportant une sequence selon l'une des 
revendications la 8, ou en ce qu'il comporte un anticorps 
selon l'une des revendications 23 a 26. 

5 43. Methode de diagnostic d'une predisposition a des 

troubles lies a FMO chez un patient, caracterisee en ce 
qu'on determine a partir d'un prelevement biologique dudit 
patient la presence d'une FMO mutee. 

10 44. Methode selon la revendication 44, caracterisee 

en ce qu ! elle utilise un anticorps mono ou polyclonal selon 
l'une des revendications 23 a 26. 

45. Methode selon l'une des revendications 43 ou 44, 
15 caracterisee en ce que la detection est ef fectuee par un 

procede ELISA ou RIA. 

46. Methode de diagnostic d'une predisposition a des 
troubles lies a FMO chez un patient, caracterisee en ce 

20 qu'on determine a partir d'un prelevement biologique dudit 
patient l'activite enzymatique d'au moins une FMO. 

47. Composition therapeutique caracterisee en ce 
qu'elle comporte a titre de principe actif au moins un 

25 compose capable de moduler l'activite FMO humaine . 

48. Composition therapeutique caracterisee en ce que 
le principe actif est capable de moduler l'activite FM02 
et/ou FMOx. 

30 

49. Composition therapeutique caracterisee en ce 
qu'elle comporte a titre de principe actif au moins un 
compose capable d'interagir avec FMO humaine. 
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50. Composition therapeutique caracterisee en ce que 

le principe actrf est capable d'interagir avec FM02 et/ou 
FMOx. 



5 51. Composition therapeutique selon l'une des 

revendications 47 a 50, caracterisee en ce qu'elle presente 

une activite differente sur FMO normale et FMO 
pathologique . 

10 52. Composition therapeutique selon 1 1 une des 

revendications 47 a 51, caracterisee en ce qu'elle comporte 
a titre de principe actif un compose a activite pro-FMO. 

53. Composition selon la revendication 52, 
15 caracterisee en ce que le compose a activite pro-FMO est 

choisi parmi les composes suivants : 

a) une proteine ou un polypeptide selon la revendication 
29, 

b) un vecteur d 1 expression selon l'une des revendications 
20 10 a 15, 

c) une sequence nucleotidique selon l'une des 
revendications 1 a 4, caracterisee en ce que ladite 
sequence est une sequence sens induisant 1' expression de 
FMO. 

25 

54. Composition therapeutique selon l'une des 
revendications 47 a 51, caracterisee en ce qu'elle comporte 
a titre de principe actif un compose a activite anti-FMO. 

30 55. Composition selon la revendication 54, 

caracterisee en ce que le principe actif est choisi parmi 
les composes suivants : 

a) un anticorps anti-FMO, selon l'une des revendications 23 
a 26, 

35 b) un vecteur d' expression selon l'une des revendications 
10 a 15, 
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Sequence . nucleotidicrue codant pour une f lavine mono- 
oxygenase, proteine correspondante et leurs applications 
dans les domaines du diagnostic et de la therapie 

La presente invention concerne notamment la 

5 flavine mono -oxygenase 2 humaine (hFM02) , ainsi qu 1 une 
autre enzyme humaine de la famille FMO, hFMOx, leurs 
sequences nucleotidiques et polypeptidiques . La presente 
invention concerne egalement, des vecteurs de clonage et/ou 
d' expression contenant lesdites sequences nucleotidiques et 

10 des cellules transformees par ces vecteurs ainsi que des 
methodes de preparation desdits polypeptides. L' invention 
comprend aussi des methodes de selection de composes et de 
diagnostic de predisposition a des pathologies et/ou des 
deficiences liees aux FMOs ainsi que des compositions 

15 pharmaceutiques comportant lesdits composes destines au 
traitement et/ou a la prevention de ces pathologies. 

Les flavines mono -oxygenases (FMOs) (Lawton et 
al . , 1994) forment une famille d'enzymes microsomales 
catalysant l'oxydation NADPH-dependante de nombreux 

20 composes organiques exogenes (xenobiotiques) possedant un 
heteroatome nucleophile comme en particulier 1 ' atome 
d' azote, de soufre, de phospore ou de selenium (Ziegler, 
D.M., 1988 ; Ziegler, D.M., 1993), qu'il s'agisse de 
medicaments, de pesticides ou autres substances 

25 potentiellement toxiques. La cysteamine est le seul 
substrat endogene actuellement connu des FMOs. 

Les FMOs representent une famille multigenique . 
L' expression de formes differentes de FMOs est dependante a 
la fois du tissu et de l'espece consideres. 

30 Les FMOs ont ete localisees dans differents 

types de tissus, en particulier le foie, les poumons et les 
reins . 

A ce jour, cinq isoformes des FMOs ont ete 
caracterisees dans l'espece de reference, le lapin. Leur 
35 homologie est de 50-60 %. Quatre de ces isoformes, FMOl, 
FM03, FM04 et FM05 ont ete* identifiees chez 1 1 homme 



'■DOC ID: <WO 98249 14A1_I_> 



1 



WO 98/24914 PCT/FR97/02226 

2 

(sequences GeneBank M64082, M83772, Z11737 et L37080 

respecjtivement )_ . Parmi le s especes _mammif eres 1.' homologie 

entre FMO orthologues est superieure a 80 %. L ' existence 
d'une FM02 , voire d'autres isoformes, chez I'homme, peut 
5 etre raisonnablement postulee. 

Les FMOs sont associees au reticulum 
endoplasmique et sont impliquees dans la detoxification de 
composes xenobiotiques, la mono -oxygenation permettant de 
transformer le xenobiotique en substance plus polaire, 

10 etape preliminaire avant son excretion. Elles peuvent 
egalement etre impliquees dans 1* activation metabolique de 
differents composes toxiques et/ou carcinogenes presents 
dans 1 1 environnement . 

Le mecanisme de la reaction FMO a ete decrit de 

15 maniere detaillee (Poulsen, L.L. et al . , 1995). Par 
opposition a toutes les autres oxydases ou mono-oxygenases 
connues, les FMOs ont la propriete unique de former une 
enzyme intermediaire stable 4a-hydroperoxy flavine, 
NADP(H)- et oxygene - dependant e , en 1 ' absence de substrat 

20 oxydable . Parce que 1 1 energie de catalyse est deja presente 
dans 1 1 enzyme FMO avant le contact avec son substrat 
potentiel, 1' adequation du substrat n'a pas besoin d'etre 
aussi precise que pour d'autres types d' enzymes. Cette 
caracteristique specif ique de la FMO est responsable de la 

25 grande variete de substrats acceptes par les FMOs (incluant 
par exemple les alkyl- et aryl-amines tertiaires et 
secondaires, de nombreuses hydrazines, thiocarbamides , 
thioamides, sulfides, disulfides, thiols) . 

De nombreuses molecules, composes actifs de 

30 medicaments, sont reconnues comme substrats des FMOs, soit 
pour une N-oxydation, soit pour une S-oxydation (Gasser, 
1996) , parmi lesquels on trouve notamment des anti- 
depresseurs, des antipsychotiques , des anti -ulcereux, des 
vasodilatateurs et des anti-hypertenseurs . 

35 Bien que certains substrats de FMO soient oxydes 

en derives moins actifs, de nombreux composes nucleophiles 
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peuvent etre metabolises en intermediaires pouvant etre 
plus reactifs et/ou potent iellement toxiques ; plutot que 
d'etre excretes, de tels produits peuvent induire des 
reponses toxiques par fixation covalente a des 

5 macromolecules cellulaires, ou par d'autres mecanismes . Par 
exemple, les mercaptopyrimidines et les thiocarbamides 
peuvent etre actives de maniere predominante par une 
activite FMO (Hines et al . , 1994). De maniere plus precise, 
il a ete montre que la nephrotoxicity associee au conjugue 

10 glutathion de l'acroleine est liee a son metabolisme medie 
par la FMO renale ; la FMO forme un S-oxyde qui est ensuite 
libere, par reaction d 1 elimination catalysee en milieu 
basique, sous forme d'acroleine cytotoxique (Park, S.B. et 
al . , 1992). Ainsi, les FMOs peuvent jouer un role important 

15 aussi bien dans les premieres etapes de toxicite chimique 
que dans la detoxification de composes xenobiotiques . 

Comme decrit ci-dessus, un grand nombre de 
medicaments aujourd'hui en phase d'essais cliniques, ou 
largement prescrits, contiennent des fonctions a caractere 

20 nucleophile de type azote, soufre, phosphore ou autres . Le 
role de la FMO dans le metabolisme oxydatif des medicaments 
et des composes chimiques endogenes chez 1 1 homme est 
cependant mal connu. 

Cashman et al . (1996) ont recemment etudie les 

25 contributions des enzymes FMOs dans le metabolisme 
physiologique de la cimetidine et de la S -nicotine in vivo. 
La plus grande partie de leurs resultats confirme le fait 
que 1' activite FM03 du foie d'adulte est responsable de 
1 ' oxygenation de la cimetidine et de la S-nicotine, cette 

30 oxygenation etant stereospecif ique . Les auteurs montrent en 
outre que la stereochimie des metabolites principaux de la 
cimetidine et de la S-nicotine chez des petits animaux 
d 1 experimentation est distincte de celle observee chez 
1' homme, et suggerent que differentes isoformes de FMOs 

35 pouvant etre predominantes selon les especes, ceci peut 
avoir des consequences importantes quant au choix des 
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animaux d * experimentation pour les programmes d ' elaboration 

et de developpement de medicaments chez 1 1 homme . 

La FMOl est connue pour etre exprimee chez 
1 1 homme dans les reins, mais pas dans le foie. La FM02 est 

5 exprimee majoritairement dans les poumons chez toutes les 
especes de mammiferes testees. La FM03 a ete isolee chez 
1 1 homme dans le foie ou elle est predominante chez 
l'adulte. La FM03 est 1 1 isof orme majeure impliquee dans la 
sulf oxydation de la methionine et dans 1 ' oxygenation 

10 stereospecif ique de la cimetidine et de la S-nicotine. La 
FM03 presente une specificite pour son substrat plus grande 
que celle des FMOl trouvees dans le foie de la plupart des 
especes animales etudiees . La FM04 est une isoforme mineure 
dont la fonction et la specificite de substrat sont peu 

15 connues . Elle est presente dans le foie humain et est aussi 
exprimee dans le cerveau ou elle pourrait etre impliquee 
dans 1* oxydation de medicaments antidepresseurs comme 
1 1 imipramine . La FMOB est exprimee dans le foie de 1 1 homme 
de maniere moins importante que la FM03 . Son apparent 

20 manque d'efficacite en tant qu* enzyme impliquee dans le 
metabolisme de medicaments, suggere qu'elle pourrait etre 
impliquee dans une fonction physiologique . 

Les differents profils d 1 expression des 
isoformes de FMO selon les tissus et/ou especes constituent 

25 done probablement un facteur significatif contribuant aux 
differences d'activites FMO observees entre les tissus 
et/ou entre especes . -Ainsi , la variete des formes de FMOs 
pourrait avoir un impact significatif sur la difference des 
reponses de tissus et/ou especes a I 1 exposition a un 

30 compose xenobiot ique . En effet, les differences observees 
entre les tissus et/ou especes dans la reponse aux composes 
xenobiotiques et dans leur toxicite sont liees pour une 
part importante aux variations d'activite et de specificite 
impliquees dans le metabolisme de ces substrats par les 

35 FMOs. Facteurs genetiques et specificite tissulaire dans 
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1' expression des FMOs sont des facteurs importants de ces 
variations . 

Concernant les facteurs genetiques, il a ete 
decrit par exemple que la trimethylaminurie , pathologie 

5 presente chez 1 % de sujets blancs britanniques et qui se 
manifeste par une forte odeur de poisson avarie dans 1 ' air 
expire, la sueur ou 1' urine, est liee a une deficience 
d'origine genetique du fonctionnement d'une FMO hepatique. 

Pour les raisons . evoquees precedemment , il 

10 existe done aujourd ' hui un besoin important d' identifier de 
nouvelles isoformes de FMO ainsi que les polymorphismes 
genetiques eventuellement associes, presentant des 
specificites quant a leurs substrats et/ou leur profil 
d* expression tissulaire, qui pourraient etre impliquees 

15 dans le metabolisme de xenobiotiques , tel que le 
metabolisme de medicaments ou de substances exogenes 
presentes dans 1 1 environnement comme par exemple les 
pesticides, ou encore qui pourraient etre impliquees dans 
une fonction physiologique . Ceci est precisement l'objet de 

20 la presente invention. 

Plusieurs genes de la famille des FMOs humaines 
ont ete localises sur la region lq23-25 du chromosome 1 par 
hybridation in situ du chromosome en metaphase. 

Des lors qu ' une telle region candidate a ete 

25 definie, il est necessaire d' avoir acces au fragment du 
genome couvrant l'intervalle ou se situe(nt) lets) gene(s) 
recherche (s) . Cette etape passe par 1 ' etablissement d'une 
carte physique, a savoir le recouvrement de la region par 
un ensemble de fragments clones et ordonnes. Aujourd 'hui, 

30 grace aux donnees de la carte integree CEPH/Genethon du 
genome humain, environ 80 % du genome est recouvert par des 
clones de YACs, sous clones en BACs dont la localisation 
sur les chromosomes se fait par 1 ' intermediaire de 
marqueurs polymorphes et genet iquement ordonnes (Chumakov 

35 et al . , 1995). Cette carte physico-genetique permet de 
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gagner un temps considerable, notamment par 1 1 utilisation 

du sequengage _ exhaust if des regions, d 1 int ere t_. 

Ainsi selon la presente invention, il a ete 
etabli, apres localisation du BAC 123H04M sur le locus 

5 genetique lq24-25 precedemment cite, que l 1 insertion qu'il 
porte contient les parties 3 1 de hFM03 , 5' de hFMOl, ainsi 
que la sequence complete de hFM02 , et celle d'un autre 
nouveau gene membre de la famille FMO, le hFMOx. 

En outre, grace a 1 1 utilisation de banques 

10 d 1 etiquettes 5', on peut verifier 1' expression des genes 
candidats identifies comme precedemment : 1 ' identification 
d'une etiquette hybridant a 1 1 une des sequences candidates 
indique, puisque celle-ci est issue d'une banque d 1 ADNc , la 
presence d'ARNm et done d'une expression des sequences en 

15 question dans les tissus consideres. 

C'est pourquoi la presente invention concerne 
notamment un polynucleotide isole, dont la sequence SEQ ID 
N° 1 est partiellement representee sur la Figure 2, et qui 
20 code pour un polypeptide de sequence SEQ ID N° 3 
representee sur la Figure 1. 

La presente invention concerne egalement un 
polynucleotide isole, dont la sequence SEQ ID N° 4 est 
partiellement representee sur la Figure 10, et qui code 
25 pour un polypeptide de sequence SEQ ID N° 6. 

Ces deux sequences nucleotidiques sont celles de 
deux genes codant pour de nouvelles enzymes de la famille 
des mono-oxygenases a flavine (FMO) humaines, 

30 respect ivement hFM02 et hFMOx. Ceci a ete etabli par 
comparaison des sequences identifiees aux sequences deja 
connues de FMO : des homologies structurales tres fortes 
entre les deux sequences etudiees et celles des FMO, des 
homologies tres fortes entre la premiere sequence et les 

35 FM02 connues, notamment celle de macaque (FM02 de macaque : 
sequence GeneBank U59453), ainsi qu 1 une homologie non 
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suffisante . de la seconde sequence avec aucune des FMO deja 
repertoriees chez 1 1 homme ont permis de conclure. 

La structure exonique des genes de la famille 
FMO deja connus est entierement conservee dans la sequence 
5 nucleotidique hFM02 selon 1 ! invention. Les sequences de 
chacun des 9 exons du polynucleotide selon 1' invention 
(Figure 3) presentent des degres d'homologie variant de 
95 % a 98 % en ADN avec la sequence correspondante de l'ARN 
messager de la FM02 de macaque (Figure 4). Les divergences 

10 entre les deux sequences nucleotidiques , ainsi que leur 
signification envers la sequence peptidique, sont 
presentees sur la Figure 5 . La sequence polynucleotidique 
SEQ ID N° 1 selon 1' invention code pour un polypeptide de 
sequence SEQ ID N° 3 de 535 acides amines (Figure 1) ; la 

15 sequence SEQ ID N° 2 de l'ARN messager predite, ainsi que 
la sequence polypeptidique de la proteine humaine sont 
homologues a 97 % avec celles de la FM02 de macaque 
(Figures 6 et 7), ce qui a permis 1 1 identification du 
polypeptide selon 1' invention comme etant la FM02 humaine. 

20 Le polypeptide de sequence SEQ ID N° 3, represents a la 
Figure 1, presente egalement un haut degre d'homologie avec 
d'autres f lavines -mono -oxygenases 2 de mammiferes ; ses 
degres d'homologie avec d'autres proteines de la famille 
des f lavines -mono -oxygenases sont moins forts. 

25 Comme mentionne precedemment , 1 1 absence d'homologie 

suffisante entre les sequences correspondant a hFMOx 
sequences genomique f-SEQ ID N° 4) , d'ARN messager (SEQ ID 
N° 5) , et peptidique (SEQ ID N° 6) - et les sequences des 
FMOs connues, a permis de conclure qu'il s'agit d ' une 

30 nouvelle isoforme de FMO . 

La presente invention concerne done les 
sequences d 1 ADN ou d'ARN, 1 1 ADN pouvant etre genomique, ADN 
complementaire ou synthetique, des FMOs, notamment de hFM02 
et hFMOx , ainsi que les proteines correspondantes . 

35 La presente invention concerne en outre des 

vecteurs de clonage et/ou d 1 expression contenant lesdites 
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sequences nucleotidiques , des cellules transf ormees par ces 
vecteurs ou des animaux contenant lesdites cellules ainsi 
que des methodes de preparation desdits polypeptides sous 
la forme de polypeptides recombinants. 
5 L 1 invention comprend aussi des methodes de 

selection de compose capable de moduler l'activite FMO. 

L 1 invention concerne egalement des methodes de 
diagnostic de predisposition a des troubles lies a FMO 
ainsi que des compositions pharmaceut iques destinees au 

10 traitement et/ou a la prevention de ces troubles. 

Un premier exemple de tels troubles pourrait 
etre le glaucome primaire a angle ouvert (GPAO) . En effet, 
d'une part Sunden et al . (1996), ainsi que les inventeurs 
(Belmouden et al . , 1996), ont identifie la region 

15 chromosomique GLC1A, qui porte entre autres sequences de 
genes celles connues de la famille des FMOs , en lq23-25, 
comme liee a la survenue du GPAO juvenile (GPAO- J) . D' autre 
part, un role possible des mono-oxygenases dans l'etiologie 
du glaucome a precedemment ete suggere (Schwartzman et al . , 

20 1987). En effet, des metabolites de reactions d'oxydation, 
en inhibant l'activite Na+, K+ ATPase dans la cornee, 
contribueraient a la regulation de la transparence de la 
cornee et de la secretion humorale oculaire ; or, une 
opacite de la cornee et une hypertension oculaire sont les 

25 deux cri teres majeurs de diagnostic de glaucome. 

Ainsi, un site d ■ heterozygotie , presentant une 
segregation d'ordre -genotypique dans une famille etudiee 
pour la presence en son sein de nombreux membres atteints 
de GPAO- J, a ete identifie par les inventeurs dans 1 • exon 8 

30 du polypeptide hFM02 selon 1» invention. 

En poursuivant la recherche des pclymorphismes 
presents dans des populations choisies de faqon adequate, 
et situes dans des sequences correspondant a celles portees 
par I 1 insertion du BAC 123H04M, ou plus generalement par 

35 les sequences FMOs , on pourra identifier notamment les 
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mutations associees aux pathologies ou troubles lies a une 
alteration de FMO . 

Les differentes isoformes des FMOs semblent 
moins se distinguer par la specificite tissulaire de leur 
5 expression, que par les substrats dont elles catalysent la 
transformation. Comme indique precedemment, l 1 expression 
des FMOs a ete mise en evidence dans le foie, les poumons, 
les reins ou le cerveau. 

L ! effet pathogene d'un deficit fonctionnel d'une 
10 FMO pourrait resulter d'une capacite diminuee des tissus ou 
elle s 1 exprime a resister au stress oxydatif. 

Plus generalement , par leur role dans le 
metabolisme oxydatif et leur fonction de detoxification, 
les FMOs pourraient etre impliquees dans toute pathologie 
15 degenerative ou toxique, demontree ou a prouver, notamment 
celles ou une mort cellulaire programmee peut etre mise en 
evidence, et les maladies degeneratives du systeme nerveux 
central . 

De fagon generale, les pathologies liees au 
20 f onctionnement des FMOs, sont rassemblees sous le nom de 
« troubles lies a FMO » . 

Parmi les troubles lies a FMO, on peut citer par 
exemple, mais sans s'y limiter : 

- oxydation de medicaments, substrats de FMO, en derives 
25 moins actifs, impliquant une perte d ! efficacite dudit 

medicament ; 

- non metabolisation- de medicaments actifs sous forme de 
metabolites, perte d'efficacite dudit medicament ; 

- non metabolisation de xenobiotiques toxiques et/ou 
30 carcinogenes, dont des substances exogenes presentes 

naturellement dans 1 1 alimentation, telles que des 
alcaloldes vegetaux, ou des substances toxiques 
presentes dans 1 ' environnement , telles que les 
pesticides ou les herbicides ; 
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- metabolisation de medicaments en intermediaires pouvant 
etre . plus reactifs, impliquant un surdosage^ avec 
possibility d f effet secondaire ; 

- metabolisation de xenobiotiques , dont les medicaments ou 
5 autres substances exogenes, en intermediaires pouvant 

etre potentiellement toxiques ; et/ou 

- alteration de la fonction physiologique dans laquelle 
est impliquee la FMO ; en particulier, 1' alteration du 
f onctionnement de FMO, pourrait etre impliquee dans la 

10 symptomatologie du glaucome . 

Par « FMO », on entendra designer l'une 

quelconque des FMOs humaines connues, FMOl, FM03 , FM04 et 

FM05, ou nouvellement decrites dans la presente demande de 

brevet, a savoir FM02 ou FMOx. 
15 Certains de ces troubles pourront avoir une 

origine multigenique mais pour tous, les modifications 

d'une ou plusieurs FMOs contribuent a la survenue du 

trouble ou a son aggravation. 

Les sequences nucleotidiques 
20 La presente invention concerne, tout d'abord, 

une sequence nucleotidique isolee, caracterisee en ce 

qu'elle est choisie parmi : 

a) les sequences codant pour les proteines FM02 ou FMOx 
humaines et leurs variants proteiques, 
25 b) les sequences codant pour un fragment de ces proteines 
et ayant au moins 10 bases, 

c) les sequences genemiques FM02 ou FMOx humaines et leurs 
alleles , 

d) les sequences presentant au moins 8 0 %, et de preference 
30 au moins 90 %, d'homologie avec les sequences (a) et (c) , 

e) les fragments des sequences (c) ou (d) ayant au moins 10 
bases , 

f) les sequences qui s 1 hybrident avec une sequence de (a) a 
(e) . 

35 . II doit etre compris que la presente invention 

ne concerne pas les sequences nucleotidiques genomiques 
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dans leur environnement chromosomique naturel, c'est-a-dire 
a l'etat naturel, il s'agit de sequences qui ont ete 
isolees, c'est-a-dire qu'elles ont ete prelevees 
directement ou indirectement , par exemple par copie (ADNc) , 
5 leur environnement ayant ete au moins part iellement 
modif ie . 

Ainsi, il peut s ' agir aussi bien d 1 ADNc que 
d'ADN genomique partiellement modif ie ou porte par des 
sequences au moins partiellement differentes des sequences 
10 les portant naturellement . 

Ces sequences pourront egalement etre qualifiees 
de « non naturelles ». 

Par « sequence nucleique », on entend un 
fragment d'ADN et/ou d'ARN naturel isole, ou de synthese, 
15 designant un enchainement precis de nucleotides, modifies 
ou non, permettant de definir un fragment, un segment ou 
une region d'un acide nucleique. 

Par « alleles », on entend designer les 
sequences mutees naturelles correspondant a des 
20 polymorphismes pouvant exister chez l'etre humain et, 
notamment, ceux qui peuvent conduire au developpement de 
troubles lies a FMO. 

Par « variant proteique », on entend designer 
1 1 ensemble des proteines mutees pouvant exister chez l'etre 
25 humain, qui correspondent notamment a des troncatures, 
substitutions, deletions et/ou additions de residus 
d 1 amino-acides , ainsi que les variants artificiels qui 
seront neanmoins egalement appeles « variants proteiques ». 
Dans le cas present, les variants sont lies en partie a la 
30 survenue de troubles lies a FMO. 

. Selon 1' invention, les fragments de sequences 
nucleiques peuvent notamment coder pour des domaines de la 
proteine ou bien etre utilises comme sonde ou comme amorce 
dans des procedes de detection ou d 1 identification ou 
35 d 1 amplification. Ces fragments presentent une taille 
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minimale _de 10 bases et on preferera des fragments de 20 

bases, et de preference 30 bases. _ __. . . 

Selon 1 T invention, l'homologie est uniquement de 
type statistique, elle signifie que les sequences 

5 presentent au minimum 80 %, et pref erentiellement 90 %, de 
nucleotides en commun. 

Pour ce qui concerne les sequences (f ) , les 
conditions d 1 hybridation doivent permettre, selon 
l 1 invention, d' assurer au moins 95 % d'homologie. 

10 Plus particulierement , la presente invention 

concerne une sequence nucleotidique choisie parmi : 
a) les sequences codant pour un polypeptide comprenant les 
amino-acides selon la sequence SEQ ID N° 3, ou selon la 
sequence SEQ ID N° 6 , 

15 b) les sequences nucleiques de SEQ ID N° 1 ou N° 2, ou les 
sequences nucleiques representees Figures 2 et 1, ou les 
sequences nucleiques de SEQ ID N° 4 ou N° 5, ou les 
sequences nucleiques representees Figure 10, ou les 
sequences nucleiques codant pour les polypeptides 

20 correspondants , 

c) un fragment d'une sequence selon (a) ou (b) comportant 
au moins 10 bases, et 

d) une sequence qui comporte par rapport aux sequences (a) , 
(b) ou (c) au moins une mutation ponctuelle, 

25 e) une sequence complementaire des sequences (a) , (b) , (c) 
ou (d) . 

La Figure -1 represente la sequence SEQ ID N° 3 , 
la Figure 2 represente partiellement la sequence SEQ ID 
N° 1 de FM02, la Figure 10 represente partiellement la 

30 sequence SEQ ID N° 4 de FMOx, telles qu'elles ont ete 
sequencees sur un genome d'un individu ne presentant pas de 
troubles FMO visibles. 

La structure du gene de hFM02 est identifiee 
dans la Figure 3 . 

35 La sequence SEQ ID N° 4 de FMOx est 

partiellement representee sur la Figure 10. 
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Pour ce qui concerne les remarques particulieres 
sur (a) , (b) , (c) , (d) et (e) , les remarques precedentes 
s ' appliquent . 

L ' invention concerne egalement des fragments de 
5 ces sequences, en particulier des sequences codant pour des 
polypeptides ayant garde tout ou partie de l'activite de la 
proteine FMO. 

Certaines de ces sequences peuvent etre 
identifiees en se reportant notamment a la Figure 3 qui 

10 schematise 1 ' organisation de hFM02 . 

Ces sequences partielles peuvent etre utilisees 
pour de nombreuses applications, comme cela sera decrit ci- 
apres, notamment pour effectuer des constructions 
proteiques de type FMO ou de types differents, mais 

15 egalement pour realiser par exemple des proteines FMO-like. 

Si les sequences decrites sont, en general, les 
sequences normales, I 1 invention concerne egalement les 
sequences mutees dans la mesure ou elles comportent au 
moins une mutation ponctuelle et de preference au plus 10 % 

20 de mutation. 

De preference, la presente invention concerne 
des sequences nucleotidiques mutees dans lesquelles les 
mutations ponctuelles sont non muettes, c'est-a-dire 
qu' elles conduisent a une modification de 1 ' amino- acide 

25 code par rapport a la sequence normale . De f agon encore 
preferee, ces mutations portent sur des amino-acides qui 
structurent les proteines FMO ou les fragments 
correspondants de celles-ci, notamment dans les regions 
correspondant aux sites catalytiques , aux sites regulateurs 

30 ou aux sites de fixation des cofacteurs ; les mutations 
peuvent egalement porter sur les sequences impliquees dans 
le transport et l'adressage ; elles peuvent aussi en 
particulier supprimer les cysteines ou, au contraire, en - 
faire apparaitre, mais egalement changer le caractere de la 

35 proteine, soit sur le plan de la charge, soit sur le plan 
de 1 1 hydrophobicite . 
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La presente invention concerne egalement les 
mutations pouvant intervenir dans les sequences promot rices . 
et/ou regulatrices des genes FMO humains, lesquelles 
peuvent avoir des effets sur I 1 expression de la proteine, 

5 notamment sur son taux d 1 expression. 

De facpon generale, la presente invention 
s'interesse aussi bien aux proteines FMO normales qu ' aux 
proteines FMO mutees, ainsi qu'a leurs fragments et aux 
sequences d'ADN et d 1 ARN correspondantes . 

10 * Parmi les fragments nucleotidiques pouvant etre 

interessants, notamment pour le diagnostic, il faut citer 
egalement les sequences genomiques introniques du gene FMO, 
par exemple les sequences jonctions entre les introns et 
les exons . 

15 L ' invention comprend les sequences nucleo- 

tidiques selon 1' invention, caracterisees en ce qu'elles 
comprennent au moins la mutation G.1263mac.A, telle qu'elle 
sera definie ci-apres dans les exemples . 

L 1 invention comprend egalement les sequences 

20 nucleotidiques selon 1' invention, caracterisees en ce 
qu'elles comportent au moins 10 bases ainsi que lesdites 
sequences nucleotidiques, utilisables notamment comme 
amorce specif ique d'un allele. 

L 1 invention comprend egalement les sequences 

25 nucleotidiques selon 1' invention, utilisables notamment 
comme amorce nucleique, de preference caracterisees en ce 
que lesdites sequences sont choisies parmi les sequences 
SEQ ID N° 7, SEQ ID N° 8, SEQ ID N° 9 et SEQ ID N° 10. 

L' invention concerne en outre les sequences 

30 nucleotidiques selon 1' invention, utilisables notamment 
comme sonde specif ique d'un allele, de preference 
caracterisees en ce que lesdites sequences sont choisies 
parmi les sequences SEQ ID N° 11, SEQ ID N° 12, SEQ ID N° 
13 et SEQ ID N° 14 . 
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L 1 invention a egalement pour objet les sequences 
nucleotidiques selon 1' invention, caracterisees en ce que 
lesdites sequences codent pour l'un des domaines de FMO. 

Les polypeptides codes par les sequences 
5 nucleotidiques selon 1' invention, notamment les 
polypeptides de sequence SEQ ID N° 3 ou SEQ ID N° 6, font 
bien entendu partie de 1' invention. 

Dans la presente description, les termes de 
proteine, polypeptide ou peptide sont interchangeables . 

10 La presente invention concerne 1 • ensemble des 

amorces qui peuvent etre deduites des sequences 
nucleotidiques precedentes et qui peuvent permettre de les 
mettre en evidence en utilisant une methode d 1 amplification 
telle que la methode PCR. 

15 La presente invention concerne egalement les 

sequences nucleotidiques qui peuvent comporter des 
nucleotides non naturels, notamment des nucleotides soufres 
ou de structure a ou P . 

Enfin, la presente invention concerne, bien 

20 entendu, aussi bien les sequences ADN qu'ARN, ainsi que les 
sequences qui s 1 hybrident avec elles, de meme que les ADN 
double brin correspondants . 

Parmi les fragments d'acides nucleiques 
interessants , il faut citer en particulier les oligo- 

25 nucleotides anti-sens, c'est-a-dire dont la structure 
assure, par hybridation avec la sequence cible, une 
inhibition de 1' expression du produit correspondant . II 
faut egalement citer les oligonucleotides sens qui, par 
interaction avec des proteines impliquees dans la 

30 regulation de 1' expression du produit correspondant, 
induiront soit une inhibition, soit une activation de cette 
expression. 

Comme cela sera decrit ci-apres, pour certaines 
applications, il peut etre necessaire de prevoir des 
35 constructions mixtes, proteine/ADN/compose chimique, 
notamment 1 ' utilisation d 1 agents intercalants par exemple ; 
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il doit etre compris que de tels composes sont couverts par 
le brevet comme comportant une sequence selon 1' invention. 
Lies proteines et polypeptides 

La presente invention concerne egalement les 

5 proteines, polypeptides ou peptides correspondant aux 
sequences mentionnees precedemment , sous forme non 
naturelle, c'est-a-dire qu'elles ne sont pas prises dans 
leur environnement naturel mais qu'elles ont pu etre 
obtenues par purification a partir de sources naturelles ou 

10 bien obtenues par recombinaison genetique, comme cela sera 
decrit ci-apres. 

L ' invention concerne egalement les memes 
polypeptides ou proteines obtenus par synthese chimique et 
pouvant comporter des amino- acides rion-naturels . 

15 La presente invention concerne les proteines 

recombinantes ainsi obtenues aussi bien sous forme 
glycosylee que non glycosylee et pouvant presenter ou non 
la structure tertiaire naturelle. 
Les vecteurs et les cellules 

20 La presente invention concerne egalement des 

vecteurs de clonage et/ou d 1 expression comportant une 
sequence nucleotidique telle que decrite precedemment. 

Ces vecteurs de clonage et d' expression pourront 
comporter des elements assurant 1 1 expression de la sequence 

25 dans une cellule hote, notamment des sequences promotrices 
et des sequences de regulation efficaces dans ladite 
cellule. 

Le vecteur en cause pourra etre a replication 
autonome ou bien destine a assurer 1 1 integration de la 
30 sequence au sein des chromosomes de la cellule hote. 

Dans le cas de systemes a replication autonome, 
en fonction de la cellule hote, procaryote ou eucaryote, on 
utilisera de preference des systemes de type plasmidique ou 
des systemes viraux, les virus vecteurs pouvant etre 
35 notamment des adenovirus (Perricaudet et al . , 1992), des 
retrovirus, des poxvirus ou des virus herpetiques (Epstein 
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et al . , 1992). L 1 homme de metier connait les technologies 
utilisables pour chacun de ces virus. 

Ainsi, il est connu d'utiliser comme vecteur 
viral des virus defectifs dont la culture est effectuee 
5 dans des cellules de complementation, ceci evitant les 
risques eventuels de proliferation d'un vecteur viral 
inf ectieux . 

Lorsque 1 1 on souhaitera 1 1 integration de la 
sequence dans les chromosomes de la cellule hote, il sera 

10 necessaire de prevoir de part et d 1 autre de la sequence 
nucleotidique a integrer une ou plusieurs sequences 
provenant de la cellule hote afin d* assurer la 
recombinaison . Il s'agit la egalement de procedes qui sont 
largement decrits dans la technique anterieure . On pourra, 

15 par exemple, utiliser des systemes de type plasmidique ou 
viral ; de tels virus seront, par exemple, les retrovirus 
(Temin 1986) ou les AAV, Adenovirus Associated Virus 
(Carter 1993) . 

L 1 invention concerne egalement les cellules 

20 procaryotes ou eucaryotes transformees par un vecteur tel 
que decrit precedemment et ceci afin d' assurer 1 • expression 
d'une proteine FMO naturelle ou variante ou bien, par 
exemple, d 1 un de ses domaines. 

Les animaux, caracterises en ce qu'ils 

25 contiennent une cellule transformee selon I 1 invention, font 
egalement partie de l 1 invention. 

L 1 invention comprend en outre un procede de 
production d'un polypeptide selon 1' invention, caracterise 
en ce qu'on cultive une cellule selon 1 ' invention et en ce 

30 que l'on recupere la proteine produite. 

Comme cela a ete indique precedemment, la 
presente invention concerne egalement les polypeptides, 
obtenus par culture des cellules ainsi transformees et 
recuperation du polypeptide exprime, ladite recuperation 

35 pouvant etre effectuee de fagon intracellulaire ou bien de 
fagon extracellulaire dans le milieu de culture lorsque le 
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vecteur a ete congu pour assurer la secretion du 
polypeptide par le biais, par exemple, d'une sequence 
« leader », la proteine etant exprimee sous forme d'une 
pre-proteine ou pre-pro-proteine. Les constructions 
5 permettant la secretion des polypeptides sont connues, 
aussi bien pour des systemes procaryotes que pour des 
systemes eucaryotes . Dans le cadre de la presente 
invention, certains des polypeptides FMO pourront comporter 
leur propre systeme de secretion ou d 1 insertion 

10 membranaire . 

De preference, 1 1 invention concerne les 
polypeptides specifiques de formes mutees des proteines 
selon 1* invention, caracterises en ce que leur sequence est 
choisie parmi les sequences polypeptidiques comprenant au 

15 moins une mutation. 

Parmi les cellules utilisables pour la 
production de ces polypeptides, il faut citer bien entendu 
les cellules bacteriennes (Olins et Lee, 1993) , mais 
egalement les cellules de levure (Buckholz, 1993), de meme 

20 que les cellules animales, en particulier les cultures de 
cellules de mammifere (Edwards et Aruffo, 1993) mais 
egalement les cellules d' insectes dans lesquelles on peut 
utiliser des precedes mettant en oeuvre des baculovirus par 
exemple (Luckow, 1993). 

25 Les cellules ainsi obtenues peuvent permettre de 

preparer des polypeptides naturels ou variants FMO , mais 
egalement des fragments de ces polypeptides, notamment des 
polypeptides pouvant correspondre aux differents domaines 
en cause. 

30 L 1 invention comprend egalement les anticorps 

mono- ou polyclonaux diriges contre les polypeptdides selon 
1' invention, de preference, caracterises en ce qu'ils sont 
obtenus par reaction immunologique d'un organisme humain ou 
animal avec un agent immunogene constitue par un 

35 polypeptide selon 1' invention, notamment un polypeptide 
recombinant ou synthetique selon l 1 invention ; de- 
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preference 1 1 agent immunogene sera constitue par un 
polypeptide specifique de la forme mutee de la proteine 
obtenue selon le procede precedemment decrit, la sequence 
dudit polypeptide etant choisie parmi les sequences 

5 polypeptidiques comprenant au moins une mutation. 

L' invention concerne egalement les anticorps 
selon 1' invention, caracterises en ce qu'il s ' agit 
d' anticorps marques, notamment pour 1 1 imagerie . 

Ces anticorps monoclonaux ou polyclonaux marques 

10 et correspondant notamment a tout ou partie des proteines 
mutees pourront etre utilises par exemple comme agent 
d' imagerie, in vivo ou ex vivo sur des prelevements 
biologiques (imagerie a 1 ' aide d' anticorps couples a une 
molecule detectable en imagerie de type PET- scan, par 

15 exemple) . 

Les modeles cellulaires 

Les cellules transformees telles que decrites 
precedemment pourront egalement etre utilisees a titre de 
modele afin d'etudier les interactions entre les FMOs et 

20 les partenaires, composes chimiques et proteiques, 
impliques directement ou indirectement dans l'activite FMO, 
et afin d'etudier les differentes interactions mises en 
cause selon qu'il s'agit d'une FMO normale ou d'un variant. 
Mais surtout ils pourront etre utilises pour la selection 

25 de produits interagissant avec les FMOs, normales ou 
variantes, a titre d'agoniste, notamment d'activateur 
enzymatique, ou d '_antagoniste , notamment d'inhibiteur 
enzymatique . 

Une autre application potentielle de la 
30 caracterisation de ces genes est done la possibility 
d' identifier des composes, notamment proteiques, 
interagissant avec ces FMOs . II peut s ' agir aussi bien 
d ! inhibiteurs que d 1 activateurs , de substrats ou de 
cofacteurs, par exemple. Leur identification permettra de 
35 les utiliser en fonction de leurs interactions avec la 
proteine normale ou la proteine variante . En particulier, 
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on pourra chercher a isoler des agents ayant des effets 
dif ferents sur les FMOs normales et variantes. 

On pourra aussi utiliser ces modeles cellulaires 
pour etudier le metabolisme de xenobiotiques , medicaments 

5 ou autres, par une FMO, normale ou variante . Ceci pourra 
etre mis en oeuvre dans 1 ' identification du pouvoir toxigue 
de certains composes, dans la selection et le developpement 
de composes a toxicite reduite, ou a activite accrue, ou 
dans celui de FMOs modifiees, ayant un meilleur pouvoir de 

10 metaboliser les composes d 1 interet . 

Ce type de modele cellulaire peut etre realise 
en mettant en oeuvre des techniques de genie genetique. II 
s'agit, suivant le type de cellules que 1 1 on desire 
utiliser, de doner le gene en question sous sa forme 

15 normale ou sous sa forme mutee dans un vecteur 
d' expression, qu'il s'agisse d'un vecteur a replication 
autonome ou d'un vecteur d 1 integration, ledit vecteur 
comportant 1 1 ensemble des elements permettant 1' expression 
du gene dans la cellule en cause, ou celle-ci ayant 

20 1' ensemble des elements permettant l 1 expression de la 
sequence en cause. 

On obtient ainsi des cellules eucaryotes ou 
procaryotes exprimant la ou les proteines FMO, normales ou 
variantes, qui pourront alors constituer des modeles 

25 permettant de tester tout a la fois les interactions de 
differents produits avec les proteines FMO ou leurs 
variants, ou de testex des composes, notamment des produits 
chimiques de synthese, pouvant interagir avec le produit du 
gene FMO, normal ou mute, et ce en les ajoutant dans le 

30 milieu de culture desdites cellules. 

II faut, en particulier, remarquer que les 
produits en question pourront aussi bien etre des agents a 
activite antagoniste qu'agoniste. 

L 1 utilisation de modeles cellulaires en vue de 

35 tester des composes pharmaceutiques est bien connue, la 
encore il n'y a pas lieu de detailler ce type de modele. On 
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peut cependant citer, parmi les techniques utilisees, le 
« Phage Display » (Allen et al . , 1995), et les methodes de 
double -hybride (Luban et Gof f . , 1995). 

Ces modeles peuvent etre de type in vitro, par 

5 exemple des cultures de cellules humaines, soit en culture 
normale, soit eventuellement sous forme d ! organe isole. 

La presente invention concerne egalement des 
organismes tels que les animaux, en particulier des souris, 
exprimant le phenotype correspondant a la FMO normale ou 

10 variante d'origine humaine . La encore, ces animaux pourront 
etre utilises comme animaux modeles pour tester 
l'efficacite de certains produits pharmaceutiques . 

La presente invention concerne egalement les 
produits obtenus par la mise en oeuvre des modeles 

15 cellulaires precedents. 
Methode de diagnostic 

La presente invention concerne, comme cela a ete 
dit precedemment, plus particulierement des methodes de 
diagnostic de predisposition a des troubles lies a FMO chez 

20 un patient, caracterisees en ce qu'on determine a partir 
d'un prelevement biologique dudit patient la presence d'une 
mutation dans au moins une sequence codant pour une FMO par 
1' analyse de tout ou partie d'une sequence nucleique 
correspondant audit gene, la presence d'au moins une telle 

25 mutation etant indicative d'une predisposition dudit 
patient a des troubles lies a FMO. 

II est important de preciser que la presente 
invention ne decrit en detail que hFM02 et hFMOx , mais les 
methodes de diagnostic et les compositions a visees 

30 therapeutiques concernent aussi bien les FMOs precedentes 
que FM01, FM03 , FM04 et FM05 . En effet, les FMOs en general 
interviennent dans le metabolisme des xenobiotiques et les 
troubles qui y sont associes, tels que, par exemple, les 
xenobiotiques et les troubles lies a FMO cites 

35 precedemment . 
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Parmi les mutations qui sont recherchees, il 
faut citer plus particulierement la mutation G.1263mac.A. 
(localisee sur la Figure G) . 

Les sequences d'acides nucleiques analysees 
5 pourront etre aussi bien de 1 1 ADN genomique, un ADNc ou un 
ARNm. 

Comme cela a ete dit precedemment, parmi les 
troubles lies a FMO qui peuvent etre mis en evidence, on 
entend plus particulierement les pathologies associees au 

10 metabolisme de xenobiotique telles que citees precedemment , 
ou associees a la fonction biologique de FMO, mais il peut 
exister d'autres troubles qui pourraient etre lies a une 
anomalie des FMOs . 

Les outils de diagnostic bases sur la presente 

15 invention, bien qu'ils puissent permettre un diagnostic 
positif et differentiel chez un patient pris isolement, 
seront de preference interessants pour un diagnostic 
presymptomatique chez un sujet a risque, notamment avec 
antecedent familial, et il est possible egalement de 

20 prevoir un diagnostic ante-natal. 

En outre, la mise en evidence d 1 une mutation 
specif ique peut permettre un diagnostic evolutif, notamment 
quant a 1 ' intensite du trouble ou a 1 1 epoque probable de 
son apparition. 

25 Les methodes permettant de mettre en evidence la 

mutation dans un gene par rapport au gene naturel sont, 
bien entendu, tres nombreuses . On peut essentiellement les 
diviser en deux grandes categories, le premier type de 
methode est celui dans lequel la presence d'une mutation 

30 est detectee par comparaison de la sequence mutee avec la 
sequence correspondante naturelle non mutee, et le second 
type dans lequel la presence de la mutation est detectee de 
fa^on indirecte, par exemple par la mise en evidence de 
misappariements dus a la presence de la mutation. 

35 Dans les deux cas, on preferera en general les 

methodes dans lesquelles tout ou partie de la sequence 
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correspondent a FMO est amplifiee prealablement a la mise 
en evidence de la mutation, ces methodes d ' amplification 
pouvant etre realisees par des methodes dites PCR ou PCR- 
like. Par PCR-like on entendra designer toutes les methodes 
5 mettant en oeuvre des reproductions directes ou indirectes 
des sequences d ! acides nucleiques, ou bien dans lesquelles 
les systemes de marquage ont ete amplifies, ces techniques 
sont bien entendu connues, en general il s'agit de 
1 1 amplification de 1'ADN par une polymerase ; lorsque 

10 1 1 echantillon d'origine est un ARN il convient 
prealablement d'effectuer une transcription reverse. Il 
existe actuellement de tres nombreux procedes permettant 
cette amplification, par exemple les methodes dites NASBA 
« Nucleic Acid Sequence Based Amplification » (Compton 

15 1991) , TAS « Transcription based Amplification System » 
(Guatelli et al . , 1990), LCR « Ligase Chain Reaction » 
(Landegren et al . , 1988), « Endo Run Amplification » (ERA), 
« Cycling Probe Reaction » (CPR) , et SDA « Strand 
Displacement Amplification » (Walker et al . , 1992), bien 

20 connues de 1 ' homme du metier. 

Le Tableau 1 presente des sequences d' amorces 
utilisables pour amplifier les sequences interessant la 
mutation G.1263mac.A. 

Le reactif utilise pour detecter et/ou 

25 identifier une mutation du gene FMO dans un echantillon 
biologique comprend une sonde dite de capture et/ou une 
sonde dite de detection, 1 1 une au moins de ces sondes 
comportant une sequence selon la presente invention decrite 
precedemment . 

30 Recherche de mutations ponctuelles 

De facpon generale, plusieurs methodes de 
detection peuvent etre appliquees ou adaptees si 
necessaire, apres amplification des sequences d ! interet par 
PCR. A titre d'exemples, on peut citer : 
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1) Sequengage : comparaison des sequences de plusieurs 
_ individus et/ou reperage d'un site d ' heterozygotie_ chez 

un seul individu. 

2) « Single nucleotide primer extension » (Syvanen et al . , 
5 1990). Des exemples d'amorces utilisables pour detecter 

la mutation G.12 63mac.A par cette methode figurent dans 
le Tableau 2 . 

3) RFLP « Restriction Fragment Length Polymorphism ». Un 
exemple d' enzyme de restriction utilisable pour detecter 

10 la mutation G.1263mac.A. par RFLP est presente sur le 

Tableau 3 . 

4) Recherche de « Single Strand Conformation 
Polymorphisms » (SSCP) . 

5) Methodes basees sur un clivage des regions misappariees 
15 (clivage enzymatique par la SI nuclease, clivage 

chimique par differents composes tels que la piperidine 
ou le tetroxide d' osmium, etc. 

6) Mise en evidence d ' heteroduplex en electrophorese. 

7 ) Methodes basees sur 1 1 utilisation en hybridation de 
20 sondes oligonucleot idiques specif iques d 1 alleles : 

« Allele Specific Oligonucleotide » (ASO) (Stoneking et 
al . , 1991). Des exemples de sondes utilisables pour la 
detection de la mutation G.1263mac.A. par ASO figurent 
sur le Tableau 4 . 
25 8) Methode OLA « dual color Oligonucleotide Ligation 
Assay » (Samiotaki et al . , 1994). 
9) Methode ARMS ^Amplification Refractory Mutation 
System », ou ASA « Allele Specific Amplification », ou 
PASA « PGR Amplification of Specific Allele » (Wu et 
30 al . , 1989) . 

Cette liste n'est pas exhaustive, et d'autres 
methodes bien connues peuvent etre utilisees. 
Recherche de remaniements , par exemple de type deletions 

D'autres methodes bien connues et basees sur les 
35 techniques d 1 hybridation a 1 1 aide de sondes genomiques, de 
sondes ADNc , de sondes oligonucleot idiques ou de ribosondes 



>DOCID:<WO 9824914A1 I > 



WO 98/24914 PCT/FR97/02226 

25 

peuvent etre utilisees pour la recherche de ce type de 
remaniements . 

Font done, ainsi, egalement partie de 
1' invention, les methodes de diagnostic d f une 
5 predisposition a des troubles lies a FMO chez un patient 
selon l 1 invention, caracterisees en ce que ladite analyse 
est realisee par hybridation, ladite hybridation etant 
realisee de preference a 1 1 aide d'au moins une sonde 
oligonucleotidigue specif ique de 1' allele, ou en ce que la 

10 presence d'une mutation est detectee par comparaison avec 
la sequence correspondante naturelle non mutee, ou en ce 
que ladite analyse est realisee par sequengage, ou par 
migration electrophoretique , et plus particulierement par 
SSCP ou DGGE, ou en ce que ladite analyse est realisee par 

15 une methodologie visant a detecter une troncation de la 
proteine . 

Font aussi partie de 1 ! invention, les methodes 
de diagnostic d'une predisposition a des troubles lies a 
FMO chez un patient selon 1' invention, caracterisees en ce 
20 que tout ou partie de la sequence nucleique du gene FMO est 
amplifiee prealablement a la mise en evidence de la ou des 
mutations, de preference 1 ' amplification est realisee par 
PCR ou PCR-like, les amorces choisies pour realiser 

I * amplification etant de preference choisies parmi les 
25 amorces selon l 1 invention. 

Les reactifs pour detecter et/ou identifier une 
mutation du gene FMO dans un echantillon biologique, 
caracterises en ce qu f il comprennent une sonde dite de 
capture et/ou une sonde dite de detection, 1 ' une au moins 
30 de ces sondes comportant une sequence selon 1' invention, ou 
un anticorps selon l 1 invention, font egalement partie de 

I I invention . 

Methodes basees sur la detection du produit du gene 

Les mutations du gene FMO peuvent etre 
35 responsables de differentes modifications du produit de ce 
gene, modifications utilisables pour une approche 
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diagnostique. En effet, les modifications d ' antigenicity 
peuvent permettre la mise au point d'anticorps. specif iques.. 
Toutes ces modifications peuvent etre utilisees en approche 
diagnostique, grace a plusieurs methodes bien connues 

5 basees sur 1 1 utilisation d'anticorps mono- ou polyclonaux 
reconnaissant la proteine normale ou des variants mutes, 
par exemple methode RIA ou ELISA. 

Enfin, il est egalement possible de 
diagnostiquer une predisposition a des troubles lies a FMO, 

10 chez un patient, en mesurant 1 ! activite enzymatique de la 
(ou des) FMO a partir d ' echantillons biologiques dudit 
patient. La mesure de cette (de ces) activite (s), par 
comparaison avec un etalon, interne ou externe, sera en 
effet indicative d'une predisposition a l'un des troubles 

15 precedemment cites. 

Compositions therapeutiques 

La presente invention concerne egalement les 
traitements therapeutiques, curatifs ou preventifs, de 
troubles lies a FMO . 

20 On pourra utiliser les composes impliques 

directement ou indirectement dans 1' activite FMO, issus de 
1 ' utilisation des modeles cellulaires decrits precedemment. 

On pourra particulierement utiliser les composes 
capables d'interagir avec les FMOs, normales ou variantes, 

25 a titre d ! agoniste ou d 1 antagoniste notamment . 

La presente invention concerne egalement des 
compositions therapeutiques comportant a titre de principe 
actif un compose capable de moduler I'activite FMO, il peut 
s'agir de composes a activite pro-FMO, notamment tels que 

30 decrits precedemment, ou des composes a activite anti-FMO. 

De fa<?on generale, on entendra par compose a 
« activite pro-FMO » un compose qui induira 1 1 activite FMO, 
au contraire un compose anti-FMO aura tendance a reduire 
I'activite FMO. L' effet reel de ces types d'activites 

35 dependra du type d 1 enzyme exprimee, normale ou 
pathologique . 
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De fagon preferee, on pourra utiliser des 
compositions therapeutiques dont l 1 activite sera differente 
envers les enzymes FMOs normales et variantes. 

II est tout d'abord possible de prevoir un 

5 traitement de substitution, c'est-a-dire des compositions 
therapeutiques caracterisees en ce qu'elles comportent a 
titre de principe actif un compose a activite pro-FMO ; il 
pourra s 1 agir notamment de tout ou partie de polypeptides 
tels qu'ils ont ete decrits precedemment , ou bien d'un 

10 vecteur d 1 expression de ces memes polypeptides, ou bien 
encore de composes chimiques ou biologiques ayant une 
activite pro-FMO, une activite FMO-like ou induisant la 
production de FMO . 

II est possible egalement d' utiliser des 

15 compositions therapeutiques dans lesquelles le principe 
actif aura une action anti-FMO, en particulier ant i - FMO 
variante . Dans ce cas il s'agit d'un traitement suppressif. 
II pourra s'agir, par exemple, de composes interagissant 
avec lesdites enzymes, notamment des composes proteiques, 

20 et en particulier d' anticorps anti-FMO, notamment lorsque 
ces anticorps reconnaitront les proteines variantes. II 
pourra s'agir egalement de produits chimiques ayant une 
activite anti-FMO, notamment des antagonistes de FMO 
variante . 

25 Parmi les nombreux composes pharmaceutiques 

utilisables, il faut citer plus part iculierement , les 
sequences anti-sens interagissant avec le gene FMO normal 
ou mute, ou bien les sequences sens agissant sur la 
regulation de l'expression de ces genes, lesdits produits 

30 pouvant egalement interagir en aval des produits 
d' expression induits par les FMOs. 

II faut egalement mentionner les anticorps 
monoclonaux inhibant les FMOs, en particulier les FMOs 
mutees, et/ou inhibant les ligands correspondants et/ou les 

35 produits induits par I 1 activite FMO, qui peuvent done avoir 
des activites pro ou anti. 
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II est egalement possible de prevoir 

1' expression de proteines ou leurs f£^3nLents_ in vivo, 

notamment par le biais de la therapie genique et en 
utilisant les vecteurs qui ont ete decrits precedemment . 

5 Dans le cadre de la therapie genique, il est 

possible egalement de prevoir 1 1 utilisation des sequences 
des genes ou des ADNc precedemment decrits , « nus », cette 
technique a notamment ete developpee par la societe Vical, 
qui a tnontre qu f il etait, dans ces conditions, possible 

10 d'exprimer la proteine dans certains tissus sans avoir 
recours au support d'un vecteur viral notamment, 

Tou jours dans le cadre de la therapie genique, 
il est egalement possible de prevoir 1 1 utilisation de 
cellules transformees e-x-vivo, lesquelles pourront etre 

15 ensuite reimplantees , soit telles quelles, soit au sein de 
systemes de type organoide, tel que cela est egalement 
connu dans l'etat de la technique (Danos et al . , 1993). On 
peut egalement envisager 1 1 utilisation d ! agents facilitant 
le ciblage d'un type cellulaire determine, la penetration 

20 dans les cellules ou le transport vers le noyau. 

Ainsi, 1 ! invention a egalement pour objet une 
composition therapeutique, caracterisee en ce qu'elle 
comporte a titre de principe actif au moins un compose 
capable de moduler 1' activite FMO, de preference 1 ! activite 

25 FM02 et/ou FMOx. 

L 1 invention comprend egalement une composition 
therapeutique caracterisee en ce qu'elle comporte a titre 
de principe actif au moins un compose capable d'interagir 
avec FMO, de preference capable d'interagir avec FM02 et/ou 

30 FMOx, ou une composition therapeutique selon l 1 invention, 
caracterisee en ce qu'elle presente une activite differente 
sur FMO normale et FMO pathologique . 

L 1 invention comprend egalement une composition 
therapeutique selon 1' invention, caracterisee en ce qu'elle 

35 comporte a titre de principe actif un compose a activite 
pro-FMO, de preference choisi parmi les composes suivants : 



DOCID: <WO 982491 4A1J_> 



WO 98/24914 PCT/FR97/02226 

29 



a) une proteine ou un polypeptide selon 1' invention, 

b) un vecteur d'expression selon l l invention, 

c) une sequence nucleotidique selon l 1 invention, 
caracterisee en ce que ladite sequence est une sequence 

5 sens induisant 1 ! expression de FMO . 

li' invention concerne en outre une composition 
therapeut ique selon 1' invention, caracterisee en ce quelle 
comporte a titre de principe actif un compose a activite 
anti-FMO selon 1' invention, de preference le principe actif 

10 est choisi parmi les composes suivants : 

a) un anticorps anti-FMO selon 1' invention, 

b) un vecteur d f expression selon 1' invent ion, 

c) une sequence nucleotidique selon 1' invention, 
caracterisee en ce que ladite sequence est une sequence 

15 antisens inhibant 1' expression de FMO, 

d) une sequence nucleotidique selon 1" invention, 
caracterisee en ce que ladite sequence est une sequence 
sens inhibant 1' expression de FMO. 

L 1 invention concerne aussi une composition 
20 therapeutique selon 1 1 invention, caracterisee en ce que le 
principe actif est une sequence soluble interagissant avec 
FMO. 

L 1 invention a egalement pour objet 1 ' utilisation 
d'un principe actif, de preference au moins un produit 
25 selon 1' invention, capable de moduler ou d ! interagir avec 
FMO, FM02 et/ou FMOx, pour realiser un medicament destine 
au traitement et/ou _a la prevention de troubles lies au 
f onctionnement de FMO. 

Sous un autre aspect, 1 ! invention est relative a 
30 un procede de biodegradation ou de biosynthese de compose 
organique ou inorganique, caracterise en ce qu'il met en 
§uvre un polypeptide ou une cellule selon I 1 invention. 

Les polypeptides a activite FMO selon 
1' invention pourront en effet avantageusement etre utilises 
35 pour biodegrader suivant les reactions d'oxydation, telles 
que decrites par exemple par Ziegler (Ziegler et al . , 
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1993), les composes substrats de FMO, en particulier les 

compose s_. tels_. que _ cites, dans la pre sen .te... description, - ou 

etre utilises pour la biosynthese de compose d'interet a 
partir desdits composes substrats de FMO, notamment pour la 

5 biosynthese de medicament, d'additif alimentaire, de 
pesticide ou d' herbicide. 

Les procedes d * elaboration de compose d'interet, 
caracterises en ce qu'ils utilisent un polypeptide ou une 
cellule selon l 1 invention, font bien entendu partie de 

10 1' invention. Les polypeptides ou cellules selon 
1' invention, pourront en effet avantageusement etre 
utilises in vitro pour determiner la metabolisation 
potent ielle du compose d'interet et pour analyser les 
metabolites eventuellement obtenus, leur toxicite et/ou 

15 leur activite. Les resultats obtenus permettront de 
confirmer le compose ou de le reformuler de maniere a ce 
qu'il devienne ou pas substrat de FMO, ou a ce que les 
metabolites formes soient differents. 

Les produits susceptibles d'etre obtenus par 

20 ledit procede de biosynthese, font egalement partie de 
1 ' invention. 

Enfin, 1 f invention comprend 1 1 utilisation de 
polypeptide ou de cellule selon 1' invention, pour la 
detoxification de compose xenobiotique , substrat de FMO. 
25 Ces composes xenobiotiques peuvent etre presents dans 
1 ' environnement , tels que pesticide ou herbicide, presents 
naturellement dans les plantes comme certains alcaloldes, 
ou peuvent correspondre a des composes pharmaceutiques . 

30 D'autres caracteristiques et avantages de la 

presente invention apparaxtront a la lecture des exemples 
ci-apres, faite en se referant aux dessins annexes 
suivants : 

- Figure 1 : Sequence polypeptidique correspondant a 
35 la sequence SEQ ID N° 3 predite de hFM02, homologue humaine 
de la FM02 de macaque. 
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Figure 2 : Sequence nucleotidique correspondant 
partiellement a la sequence SEQ ID N° 1 du gene codant pour 
hFM02 , homologue humaine de la FM02 de macaque . 

Au vu des homologies des ARN messagers connus de genes 
5 de la famille des mono -oxygenases a flavine, ces genes 
partagent la meme structure exon/intron : 
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: acides 
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non traduite 3 1 . 

Les introns sont variables en taille et en complexite. 
20 Nous avons d'abord isole la sequence de trois fragments du 
BAC 123H04M qui contiennent la totalite des exons de cet 
homologue . 

Fragment 1 : contenant les exons 1 et 2, 
Fragment 2 : contenant 1 1 exon 3 , 
25 Fragment 3 : contenant les exons 4 a 9 . 

Les sequences de deux introns ont ensuite ete 
completees. ~ 
- Figure 3 : 

Figure 3A : Description de la structure exon/intron du 
30 gene codant pour hFM02 , homologue humaine de la FM02 de 
macaque . 

Sont indiquees les positions des debuts et fins 
d' exons sur les sequences nucleotidiques SEQ ID N° 1 et 
N° 2 . 

35 Figure 3B : Description de la structure exon/intron du 

gene codant pour hFMOx. 
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Sont indiquees les positions des debuts et fins 
d'exons sur les sequences nucleot idiques SEQ ID N° .4. et N.° 
5 . 

- Figure 4 : Homologie entre le gene FM02 de macaque 
5 et son homologue humain tel que presente en figure 2. 

La region 5 1 non traduite diverge legerement de la 
sequence de macaque tel que presente en figure 2. 

- Figure 5 : Releve des positions variantes de la 
sequence de 1 ' ARNm de hFM02 humain par rapport a la 

10 sequence homologue de macaque ; influence des variations 
sur la sequence proteique. 

- Figure 6 : Homologies entre les sequences d'ARMm de 
la FM02 de macaque et de son homologue humaine . 

La position de la mutation G.1263mac.A est reperee par 
15 une fleche verticale. 

Figure 7 : Homologies entre les sequences 
pept idiques de la FM02 de macaque et de son homologue 
humaine - 

Figure 8 : Analyse de la segregation du 
20 polymorphisme G.1263mac.A dans la famille etudiee. 

Li 1 ADN genomique des individus 3, 4, et 7 a 14 a ete 
amplifie par PCR, et la sequence des fragments obtenus 
analysee pour detecter des sites d 1 heterozygotie 
segregeant avec la maladie. 
25 Les symboles pie ins indiquent les individus atteints 

du GPAO juvenile. Les symboles barres indiquent des 
individus non genotypes. Les individus 11 et 12 sont 
des jumeaux. 

G/G = homozygotes pour la base en position homologue 
30 de la position 12 63 de 1 1 ARNm de la FM02 de macaque. 

G/A = heterozygotes pour la base en position homologue 
de la position 1263 de l'ARNm de la FM02 de macaque. 

- Figure 9 : Localisation chromosomique du BAC123H04M 
par hybridation in situ f luorescente . 

35 (A) Un signal specifique est observe sur les deux 

chromosomes 1. Sur la photo (B) est represents un seul 
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des deux chromosomes. 1. En (C) , seules les bandes R de 
ce chromosomes sont observees, montrant que le signal 
de la sonde 123H04M est localise sur la bande lq23. 
- Figure 10 : Sequence nucleotidique correspondant 

5 partiellement a la sequence SEQ ID N° 4 du gene codant pour 
1 1 isoforme hFMOx humaine . 

Ce gene presente un taux d'homologie de 75 % en ADN et 
de 70 % en acides amines avec les ARNs messagers de 
mono- oxygenases a flavine presents sur le BAC 123H04M. 

10 II est presente, dans cette figure preliminaire , en 

quatre fragments : 

fragment 1 : code pour 1 ' exon 2 (premier exon codant), 
fragment 2 : exon 3 , 
fragment 3 : exons 4 a 8 , 
15 fragment 4 : exon 9. 

EXEMPLES 

Isolement du BAC 123H04M 

Afin d 1 identifier un gene codant pour une nouvelle 

20 FMO, on a isole un BAC (« Bacterial Artificial Chromosome ») 
correspondant a la region candidate precedemment localisee 
sur le chromosome 1. Une banque de BACs couvrant le genome 
humain complet a ete preparee a partir de l'ADN d'une lignee 
lymphoblastique humaine derivee de 1 1 individu n° 8445 des 

25 families du CEPH . Cette lignee a ete utilisee comme source 
d'ADN de haut poids moleculaire. L 1 ADN a ete partiellement 
digere par 1 ' enzyme de^ restriction BamHl, puis clone au site 
BamHl du plasmide pBeloBacII . Les clones ainsi obtenus ont 
ete « pooles » et cribles selon une procedure d* analyse 

30 tridimensionnelle precedemment decrite pour le criblage des 
banques de YACs (« Yeast Artificial Chromosome » ) (Chumakov 
et al. , 1992). Les pools tridimensionnels obtenus ont ete 
cribles par PCR a 1 1 aide des amorces encadrant le marqueur 
D1S3423 (WI-10286) . Ce STS (« Sequence Tagged Site ») avait 

35 ete precedemment localise dans la region candidate. Un clone 
du BAC 123H04M a ete ainsi isole. 
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Apres digestion par 1 ' enzyme de restriction Not I, 
la taille de 1 1 insert porte par ce BAC a ete determinee__ sur. 
un gel d' agarose 0,8 % apres migration par electrophorese en 
champ alterne (CHEF) (4 heures a 9 Volts/cm, avec un angle 

5 de 100° , a 11°C en tampon 0,5xTAE) . On a ainsi mis en 
evidence que le BAC 123H04M porte un insert de 180 kb. 
Localisat ion chromosomique du BAC 123H04M par hybridation in 
situ fluorescente (FISH) 

La localisation chromosomique du BAC dans la 

10 region candidate Iq23-q25 a ete confirmee par hybridation in 
situ fluorescente (FISH) sur chromosomes metaphasiques, 
selon la methode decrite par Cherif et al . , 1990. Le BAC 
123H04M a ete localise plus precisement dans la bande lq23 
du chromosome 1 (Figure 9) . 

15 Secruenpaqe de 1 1 insert du BAC 123H04M 

Afin de sequencer 1 1 insert du BAC 123H04M, on a 
prepare trois banques distinctes de sous clones a partir de 
l'ADN sonique de ce BAC. 

Apres incubation une nuit, les cellules issues de 

20 trois litres de culture ont ete traitees par lyse alcaline 
selon les techniques classiques . Apres centrif ugation du 
produit obtenu dans un gradient de chlorure de cesium, 52 fig 
d 1 ADN du BAC 123H04M ont ete purifies. 7 fig d'ADN ont ete 
soniques dans trois conditions differentes, afin d'obtenir 

25 des fragments dont les tailles se distribuent uniformement 
de 1 a 9kb. Les fragments obtenus ont ete traites dans un 
volume de 50 fil avec 2 unites de Vent polymerase pendant 2 0 
minutes a 70°C, en presence des 4 deoxytriphosphates 
(100 fiM) . Les fragments aux extremites tranches resultant de 

30 cette etape ont ete separes par electrophorese en gel 1 % 
d ' agarose a bas point de fusion (60 Volts pendant 3 heures). 
Les fragments groupes selon leurs tailles ont ete excises et 
les bandes obtenues traitees par 1 ' agarase . Apres extraction 
au chloroforme et dialyse sur colonnes Microcon 100, l'ADN 

35 en solution a ete ajuste a une concentration de 100 ng/fil . 
Une ligation a ete effectuee, incubation une nuit, en 
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mettant en presence 100 ng de 1 1 ADN fragmente du BAC 123H04M 
et 20 ng d 1 ADN du vecteur linearise par digestion 
enzymatique , et traite par la phosphatase alcaline. Cette 
reaction e ete realisee dans un volume final de 10 fil en 
5 presence de 40 unites//xl de T4 ADN ligase (Epicentre) . Les 
produits de ligation ont ensuite servi a transformer par 
electroporation, soit une souche XL-Blue (pour les plasmides 
multicopies) , soit une souche D10HB (pour les sous clones 
issus du BAC) . Les clones lacZ" et resistants a 
10 1 1 antibiotique, ont ete repiques individuellement en 
microplaques pour stockage et sequengage . 
On a ainsi obtenu : 
864 sous clones issus de 1' insertion de fragments de 2 a 
3 kb au site Smal du plasmide puc!8 ; 
15 - 1728 sous clones correspondant a 1 ' insertion de 
fragments de 1 , 5 a 2 kb au site BamHI (rendu franc) du 
plasmide BluescriptSK ; 
- 2 88 sous clones port ant des fragments de 4 a 7 kb 
inseres au site Pmll d'un vecteur BAC modifie. 
20 Les inserts de ces sous clones ont ete amplifies 

par PCR sur cultures bacteriennes incubees une nuit en 
utilisant les amorces des vecteurs flanquant les insertions. 
La sequence des extremites de ces inserts (en moyenne 500 
bases de chaque cote) a ete determinee par sequenqrage 
25 automatique fluorescent sur sequenceur ABI 377, equipe du 
logiciel ABI Prism DNA Sequencing Analysis (version 2.1.2). 

Les fragments de sequence provenant des sous-BACs 
ont ete assembles par le logiciel Gap4 de R . Staden 
(Bonfield et al . , 1995). Ce logiciel permet la 
30 reconstruction d'une sequence complete a partir de fragments 
de sequences. La sequence deduite de I'alignement des 
differents fragments est la sequence consensus. 

On a enfin utilise des techniques de sequencpage 
dirige (marche systematique de 1' amorce) pour parfaire les 
35 sequences et relier les contigs. 
Analyse des sequences 
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Les exons potentiels du BAG 123H04M ont ete 
reperes^ par recherche d f homolQgie sur les bangues. publiques- 
de proteines, d r acides nucleiques et d'EST (Expressed 
Sequence Tags) . 
5 Bangues de donnees : 

On a utilise des refontes locales des principales 
banques publiques. La banque de proteines utilisee est 
constitute par la fusion non redondante des banques Genpept 
(traduction automatique de GenBank, NCBI ; Benson et al . , 

10 1996) ; Swissprot, (George et al . , 1996) ; et PIR/NBRF 
(Bairoch et al . , 1996). Les doublons ont ete elimines par le 
logiciel "nrdb" (domaine public, NCBI ; Benson et al . , 
1996). Les repetitions internes ont ensuite ete masqu£es par 
le logiciel « xnu » (domaine public, NCBI ; Benson et al . , 

15 1996). La banque resultante, denommee NRPU (Non -Redundant 
Protein- Unique) a servi de reference pour les recherches 
d 1 homologies proteiques. Les homologies trouvees avec cette 
banque ont permis de local iser des regions codant 
potentiellement pour un fragment de proteine au moins 

20 apparente a une proteine connue (exons codant s) . La banque 
d f EST utilisee est composee des sous-sections « gbest » (1- 
9) de Genbank (NCBI ; Benson et al . , 1996). Elle contient 
tous les fragments de transcrits publics. 

Les homologies trouvees avec cette banque ont 

25 permis de localiser des regions potentiellement transcrites 
(presentes sur I'ARN messager) . 

La banque d'acides nucleiques (autres que les EST) 
utilisee contient toutes autres sous-sections de Genbank et 
de 1 1 EMBL (Rodriguez -Tome et al . , 1996) dont les doublons 

30 ont ete elimines comme precedemment . 
Locriciels : 

On a utilise 1' ensemble de logiciel BLAST (domaine 
public, Altschul et al . , 1990) de recherche d'homologies 
entre une sequence et des banques de donnees proteiques ou 
35 nucleiques. Les seuils de signification dependent de la 
longueur et de la complexite de la region testee ainsi que 
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de la taille de la banque de reference. lis ont ete ajustes 
et adaptes a chaque analyse. 

Identification de polvmorphismes genetiaues associes au FMQ 
en relation avec un polvmorphisme phenotypigue associe a la 
5 survenue du glaucome juvenile GPAO-J. maladie de 
transmission autosomale dominante (locus GLC1A) 

Detection de Polymorphismes/Mutations 
1) Extraction de I'ADN 

L 1 ADN est extrait du sang veineux peripherique 
10 apres lyse cellulaire, digestion proteique, partition 
organique et finalement precipitation alcoolique. 

Le sang (20 ml) est preleve par ponction veineuse 
peripherique sur un tube contenant de l'EDTA. 

II est dilue avec un volume d'eau bidistillee. 
15 Apres 10 minutes, les cellules sont collectees par 
centrif ugation a 1600 g pendant 10 minutes. Cette 
manipulation est repetee. 

Les cellules blanches sont lysees en presence de 
20 ml de tampon CLB (Tris 10 mM pH 7.6, 5 mM MgCl 2 , sucrose 
20 0.32 M, Triton X-100 1 % (v/v). Les noyaux sont collectes 
par centrif ugation a 1600 g pendant 10 minutes. Cette 
manipulation est repetee. 

Les noyaux sont laves une fois dans le tampon RSB 
(Tris 10 mM pH 8, NaCl 10 mM, EDTA 10 mM) . Le culot est 
25 resuspendu dans 2 ml de tampon RSB auquel est ajoute du 
lauryl sulfate de sodium (1 %) et la proteinase K 
(2 00 mg/ml) . Le melange est incube a 55 °C pendant au moins 3 
heures et regulierement agite . 

La solution d'ADN ainsi obtenue est ensuite 
30 extraite avec un volume de phenol equilibre avec un tampon 
50 mM Tris pH 8. Cette operation est repetee et completee 
par une extraction avec un volume de chloroforme /alcool 
isoamylique (24 : 1 v/v) . 

L 1 ADN est precipite avec un volume d 1 isopropanol , 
35 rince a 1 ' ethanol (70 %) , seche et enfin resuspendu dans 
1 ml de tampon TE (Tris 10 mM pH 8, EDTA 0.5 mM) . La 
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concentration d'ADN est evaluee par mesure de 1 ' absorbance a 
260 nm en utilisant 1 ' equivalence de 50 /ig/ml d'ADN pour_ une 
unite d 1 absorbance . La concentration d'ADN est alors ajustee 
a 200 /xg/ml . 

5 2) Amplification de 1 1 ADN genomique 

Les amorces oligonucleotidiques utilisees pour 
1 1 amplification genomique des sequences exoniques derivees 
du BAC 123H04M, telles que predites par analyse 
inf ormatique , ont ete definies a 1 1 aide du logiciel OSP 

10 (Hillier et al . , 1991). 

Toutes ces amorces contiennent, en amont des bases 
specif iquement ciblees par 1 ' amplification , une queue 
oligonucleotidique commune, destinee a permettre le 
sequengage des fragments amplifies (PU pour les amorces en 

15 amont, et RP pour les amorces en aval ; sequences exposees 
sur le Tableau 5) . 

Les amorces oligonucleotidiques ont ete 
synthetisees selon la methode des phosphoramidites , sur un 
synthetiseur GENSET UFPS 24.1. 

20 L 1 amplification de chaque sequence exonique predite 

a ete realisee par reaction d 1 amplification en chaine par 
polymerase (PCR) , dans les conditions suivantes : 
Volume final 50 fil 

ADN genomique 100 ng 

25 MgCl2 2 mM 

dNTP (pour chacun) 20 0 fiM 

Amorce (pour chacune) _ 7.5 pmoles 

AmpliTaq Gold DNA polymerase (Perkin) 1 unite 

* Tampon de PCR 1 X 

30 * :(10X=0.1 M Tris HCl pH 8.3, 0.5 M KCl) 

L 1 amplification est realisee dans un thermocycleur 
Perkin Elmer 9600 ou MJ Research PTC200 avec couvercle 
chauffant. Apres un chauffage a 94 °C pendant 10 minutes, 35 
cycles sont effectues. Chaque cycle comprend : 3 0 secondes a 

35 94°C, 1 minute a 55°C et 30 secondes a 72°C. Un segment 
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final d " elongatipn de 7 minutes a 72 °C termine 
1 ' amplification. 

La quantite de produits d 1 amplification obtenue 
est determinee sur micro-plaque de 96 puits, par 
5 f luorometrie, utilisant 1 1 agent intercalant Picogreen 
(Molecular Probes) . 

3) Detection des polymorphismes/mutations 
- Sequence 

Les produits de 1 ' amplification genomique par 
10 PCR ont ete sequences sur sequenceur automatique ABI 377, en 
utilisant des amorces f luorescentes marquees par les 
f luorochromes ABI (Joe, Fam, Rox et Tamra) et 1 1 ADN 
polymerase Thermosequanase (Amersham) . 

Les reactions ont ete realisees en microplaques 
15 de 96 puits, sur thermocycleur Perkin Elmer 9600, dans des 
conditions classiques de cycles de temperature : 

- 8 cycles : denaturation : 5 sec. a 94 °C; hybridation : 10 
sec. ; elongation : 30 sec. a 72°C, puis 

- 13 cycles : denaturation : 5 sec. a 94 °C; elongation : 30 
20 sec. a 72°C. 

6 unites de Thermosequanase, et 5-25 ng de produit 
d' amplification ont ete utilisees par reaction de sequence. 

A 1 ' issue des cycles d 1 amplification, les produits 
des reactions de sequence sont precipites dans I'ethanol, 
25 resuspendus dans du tampon de charge contenant de la 
formamide, denatures, et deposes sur gels d'acrylamide 
4 % ; les electrophoreses (2 heures 30 a 3000 Volts) sont 
conduites sur sequenceurs ABI 377 equipes des logiciels ABI 
de collection et d' analyse (ABI Prism DNA Sequencing 
30 Analysis Software, version 2.1.2.) . 

- Analyse des sequences 

Le GPAO-J etant une maladie autosomale dominante, 
les donnees de sequence obtenues ont ete analysees afin de 
detecter la presence de sites d ' heterozygotie parmi les 
35 patients atteints de glaucome juvenile. Les sites 
d 1 heterozygotie ont ete confirmes apres comparaison des 
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sequences des deux brins d'ADN genomique de chaque individu 
concerne. Un site d 1 heterozygotie est retenu comme mutation 
candidate responsable de la survenue de troubles lies a FMO 
s'il est present dans une population de membres d'une meme 
5 famille, alors qu r il est absent en general chez les 
controles 4 non apparentes a la famille. 
- Resultats 

Parmi tous les fragments d 1 amplification derives 
du BAC 123H04M etudies, 1 1 un d'entre eux presente un site 

10 d 1 heterozygotie segregeant avec la survenue du glaucome 
juvenile dans un pedigree represents sur la Figure 8. 

Ce site d 1 heterozygotie (G/A) est present chez 7 
patients atteints de GPAO-J tandis qu'il est absent de 3 
patients sains homozygotes (G/G) , tous issus de la meme 

15 famille. De plus, 9 9 controles non apparentes sont de meme 
homozygotes (G/G) pour ce site, indiquant que la frequence 
de 1' allele A dans la population generale est inferieure a 
0 . 005 . 

Le site est contenu dans 1 1 exon 8 du gene codant 
20 pour la proteine hFM02 selon 1 1 invention ; la mutation 
decrite transforme 1 ' acide glutamique en position 402 de la 
sequence SEQ ID N° 1 de la hFM02 en lysine (Figure 1) . 

II est surprenant de remarquer que le calcul des 
lod scores integrant les donnees precedentes pour 
25 differentes hypotheses de frequences de chaque allele dans 
la population generale, indique une probability superieure 
a 100 contre 1 que 12 heterozygotie (G/A) decrite soit liee 
au GPAO-J (Tableau 6) . Cette probability est significative 
du fait que 1 ' analyse a porte sur une seule famille. 
30 Les amorces ayant permis 1 ■ amplification du 

fragment d'ADN contenant ce site d 1 heterozygotie sont 
decrites dans le Tableau 1. 

Tableau 1 : Sequences des amorces utilisees pour amplifier 
35 la region exoniaue derivee du BAC 123H04M et contenant un 
site d 1 heterozygotie lie au GPAO juvenile 
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Locus du fragment : FM02/Exon 8 
Taille du fragment amplifie : 420 

Amorces: Amont PU (SEQ ID N°7) : 5 1 TCACATAGAGTGCTATGGGGG 

Aval RP (SEQ ID N°8) : 5 1 CTTAGGAAGAAGATAAAAATGCAAC 
Tableau 2 : Exempies d 1 amorces pour detecter la mutation 
G.1263mac.A par « Single Nucleotide Primer Extension » 

a) SEQ ID N°9 : 5' AATGTCCATCATCATAGTTCTCT 3' (antisens) 

et/ou 

b) SEQ ID N°10 : 5' T AGG CTTGTGT AG C CTG C C CT C A 3' (sens) 

Tableau 3 : Identification de la mutation G.1263mac.A par 
RFLP 



5' C C C T C AG AG AG AA 3' « normal » 



site Ddel (C TNAG) 



CCCTCAaAGAGAA 3 1 « mutant » 



20 pas de coupure 

Tableau 4 : Exemple de sondes pour la detection de la 
mutation G.1263mac,A. par la technique ASO 
Specif ique de l 1 allele G 



SEQ ID N° 11 : 5' CCTCA^AGAGAACTAT 3 r et sa 

complementaire : 

SEQ ID N° 12 : 3 1 GGAGT@TCTCTTGATA 5 f 

Specif ique de 1 1 allele A 

SEQ ID N° 13 : 5 1 CCTCA[aJaGAGAACTAT 3 ' et sa 

complementaire 

SEQ ID N° 14 : 3 ' GGAGTTTCTCTTGATA 5 1 
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Tableau 5 : Sequence des amorces utilisees pour le 
seauencage des fragments d 1 amplification a partir d 1 ADN 
genomiaue 

5 PU 5 1 TGTAAAACGACGGCCAGT 

RP 5' CAGGAAACAGCTATGACC 



Tableau 6 : Lod score entre le polvmorphisme G.1263mac.A et 
10 le GPAO juvenile dans la famille etudiee en fonction de la 
frequence des deux alleles dans la population aenerale . 



Frequence de l f allele 
rare (A) 


0 (taux de 
recombinaison) 


Lod score 


0.01 


0 


2.07 


0 . 001 


0 


2.10 


0 . 0001 


0 


2 .10 


0 . 00001 


0 


2 . 10 
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SEQUENCE LISTING 
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LISTE DE SEQUENCES 



(1) INFORMATIONS GENERALES : 

(i) DEPOSANT: 

(A) NOM: GENSET 

(B) RUE: 24 RUE ROYALE 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75008 

(ii) TITRE DE L 1 INVENTION: SEQUENCE NUCLEOTIDIQUE CODANT POUR UNE 
FLAVINE MONOOXYGENASE, PROTEINE CORRES PONDANTE ET LEURS 
APPLICATIONS DANS LE DOMAINE DU DIAGNOSTIC ET 
THERAPEUTIQUE 

(iii) NOMBRE DE SEQUENCES: 14 

(iv) FORME DECHI FFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

<C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentln Release #1.0, Version #1.30 (OEB) 

(vi) DONNEES DE LA DEMANDE ANTERIEURE: 

(A) NUMERO DE LA DEMANDE: FR 9615032 

(B) DATE DE DEPOT: 06-AUG-1996 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 26016 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 



CATCAGTTAT 


CCCTGGAGGA 


TAACTAAGCC 


ATCTGCCTCC 


ATCATCTTTT 


AAGGGTTCAG 


60 


TCAGTTTAAA 


ACTTTGCTTC 


TATACCTAGG 


TATTTTCTTT 


TCTCTGTATG 


TTGGTCAGGT 


120 


ACAATTATTT 


TTAACAGGGC 


TTCCATCAAT 


ATCATAACTA 


CCTAGAGAAG 


ACATTGCAAA 


180 


GATAAAATTG 


GAGAATTGTT 


AACAGGCTGT 


TAACAAAATG 


TGTACCCAAC 


TGCCAATGAA 


240 


GTGGCTTGAT 


TTTTTTCTTT 


TTTTAAAATT 


TTTCTTTTGT 


ATCCTTTTAT 


TTTATTTACT 


300 
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TATTTTTTAG AGACACAGTC TCGCTCTGTT ACCCAGGCTG GCGTACAATG GCACAATCAT 360 

AGCCCACTGC AGTCTCGACC TCCAGGGCCT CAAGCAATCC TCCCACCTCA GCCTTCCAAG 4 20 

TAGCTGAGAC TACAAGTGCA TGCTGCCATG CCTGACTGAT TTTTTGTTTT TTGCAGAGAT 4 80 

GAAGTCTCAC TATGTTGCCC AGTCTGACCT TGAACTCCTA GCAATACCCT ACCCTGGCCT 54 0 

CCCAAACTGC TGGGATTACA GGCATGAGCC ACTGTGCCTG GCCTTTTTTC ATTTTAACTG 600 

AGAAATGTGT TCAGCTCTTT TGTTCCTTAG TCATTGATCA TCACTTTTGT TATATCTGTT 660 

AGTCTTGTCA TAGAGTTGCT GCACTTATTA CACAGAGAAG GCCTTTTATC ACGACCAATT 720 

TATTTTAGGA AATTTCAGGG AAAACGTTTT TCTAGAACAC CTTATTTGAC AT T AT AAAAC 78 0 

AACTCTTCAC TCTTGCACTC CAGACCTCCC TTTCCAGTTT TCTTTTTCTC CATAGTGGTC 84 0 

ATCACCACTT GTTTTATTTT ATTGATGGGC TGTCTGGCTC CCTCAACTGC AAAGTAAACT 900 

CCACAAAGGC AGAGAGTTTT GTCTCTTTTA TTCATTGCTG TACCTGCATC ACTTAGAAAG 960 

TTTCTGGCAC CTAGGAAGTG TTCAGTAAAT ATTTATTGAA TAAGTTTATG TAAAACGTCT 1020 

CAGACTCCTT AG AG AAACT G GTCTTTTGGG GTTGGAGAAT AAAGTTCTTT ACCTCATCAG 1080 

TTAGACTCTA TCTAAGGTAC ACGAGGGCTT GCTAGTCTCC TAAGTTAGTC TGCTAATAAA 114 0 

TGTTAACCCT AATAACTGAA ATTATTAGCA GAGGTAATTA TCCAGTTCTA TATCAAGGCA 1200 

AAAAGACAGC AGTGGATAGA AAGATCTTAG AAGTCCCACT AGGTTCATCC AAGCCACCAT 1260 

ACACATAGGC AGAAAAATCA AAATAAGATA TGAGCCTGGA CAGGGTGAGC AATCTGGGAA 1320 

AAGATGAACA CAGTATGCTA GGACCCAGAA ATCATCAAGT C TAT G AAAAC TAAGCCAGAA 1380 

CACAAATGTG AATTCCATAA GATCAGGAAC ATAATCTGTC TTGTTCATCC AGGCATGGTA 14 40 

ATCTGCCAGA AATAGTGCTT AACTGCAAGA ACTGAATATT TGTTAGATAA TTAAACCATC 1500 

AACTAAATGA GATTCATGCA ACCATGAAAA ATGCTGCTAT AGGTACACAA TATTGATATA 1560 

CTAGAAAGTT AAAAAATCAA GTTGGAAATT AGACTATTCC ATTTCTGTTT GTGTGTATGT 1620 

AT C T AC AAAT AGGTGGAAGG ATATACCAAA ATGTCAACAG CAGTTACCTC TGGGTGGTGA 1680 

GGAGTAATCT TAACCTTGTT ATTTATCCCT ATATGTTCAT TTGTGAATGA ATATTTATTA 17 4 0 

CATCATTATA AAAAGGATTT TTAAACTATC TGTATGTTTA AGAGTATATG TTGCTACTAT 1800 

GTAAGAGTAT ATGCTGTTAC TGTAAAGACA TTGCATTACT ACTGTTGACC TCAGAGCACG 18 60 

CGCCTCTTGC CTAATTCTAG GACTCCTAAC TAAGTCTTTG GAGTTTCAGC TGGAAGAATG 1920 
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CTGGAGGAAT ACGGAACTCC TCCCATTTCT CACAGCCACC TCCAACTCTT AAAAACGCTT 1980 

CCAACTGCCT CCCAGCACAC AACCAAGGGA GAAAACTATT CTGTCAAAGA GACGGTGCCA 204 0 

AAAGGCAAAA ACAAAGGTAA GGATGATCGC TGGGGAAAGA AGCTGAAAAG GAAAAGCTCA 2100 

GAACTCTAGC TGGAAATTTG GCTCACATCC CTAGTATGTT ACTGCATAGT CTGGCTTTGT 2160 

TCAATGGGTC GCTTTTAAAT ATTAAAGCTA GATGTAAGCA AGGTTTGCAA CAAAGTCCAT 2220 

AAGAAACTCA GCTTTTCTCA AAGGCAAGAA GAGAGCAGGA TTTTTGACTG GCTCTTTATT 2280 

CAATAGTGCT GCTTATTAAA TTACCACTGC TACAATGTTT AAAGCCAATT ACCTGAGCAC 234 0 

ATCATAAGGA TTCTCTTACC GGTTGTCCCA GTTAAGTAAT GTTGATTGAT CAACTCCTTG 24 00 

ACAGGAGCTG ATGGCAAAGA AGGTAGCTGT GATTGGAGCT GGGGTCAGTG GCCTAATTTC 24 60 

TCTGAAGTGC TGTGTGGATG AGGGACTTGA GCCCACTTGC TTTGAGAGAA CTGAAGATAT 2520 

TGGAGGAGTG TGGAGGTTCA AAGTAAGTGA GATTTTCTTG GGTCTTGAAC AGGTTGTGTT 2 580 

GTTATTTCAG GGTGAATCAC AGTTACTGAT GGGTCATATT GAGAAATTTA TTAAACAACT 2 64 0 

CTGATCAGAT TTTATTTCTA TTTATTGATG TGGCCATAAT GGAACTGAAG TCATAGGCTG 2700 

GCATCTCTCC CCCAGTCAAT ACTAACCCAA CCCAGGTAGC TGACCCAGGC ATGTAAAAGA 27 60 

TCTCTTCTTT TGGATTCAGC AATTGTCTTA CAGCCCATAC TTCTGTCATT CTTTAATACG 2820 

CTAATATTAG AGAACATTTT ACAAAAATAG AAGTAACAGG GATTCTTCTC AAGATATCAC 28 80 

TTCTGTTTCA ATTATTAAAC CAAATGCTTC TTTAGAGACC ATGCTCTTAT CATTACTATT 2 94 0 

TTTCTCTGAC AAATGAAGCA TGTTTGTTTA CTGAGCTTTA TCAATGACAT TCTAGTATAA 3000 

CTGCTGTGAA ACTCTTTGTT AAATATGTTT TATTAAATTT ATTCTATTAA TCAAACCAAA 30 60 

ATATTGATAA TGCTATTTGT CTGTATTAGT CCATTCTCAT GCTGCTATGA AGAAATACTG 3120 

AGACTGGGTG ATTTATAAAG GAAAGAGGTT TAATTGACTC CCAGTTCCAC AATGCTGGGG 3180 

AGGACTCAGG AAATTTACAA TCATGGCAGT QGGAAAGAGA GGTGCTGAGC AAAGGGGGAA 324 0 

AAGCCCCTTA TAAAACCATC AGATCTCATT AGAACGCACT CACTATCATG AGAACAGCAT 3300 

GAGGGTAGCT GCCCCCTTGA TTCAATTACC TACCCCCACC AGGTCCTTCC CAAGACATGT 3360 

GGGGATTGTG GGAACTACAA TTCAATATGA GATTTGGATG GGGACACAAA GCTAAACCAT 34 20 

GTCACTGTCC TTAAAAATTT GTATAAAACT TAGAAAGTTG CATAGATAGC TATAAGGAGT 34 80 

TACAATTATT CCTTCCCACA ACCTCTCAAT AGGTAGTAGC TTACCACCTT CTAGCTGTGA 354 0 
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GATCTTGAGC AAGTTATTTA CATCCTGTGT TTC AATT TAC TCAGTTATAA ATGGATATAA 3600 

TAACAGGAAA GTGTGATTAT CTCATAGTGC TATTTTGAAG ATTAAGGGAG AT AAT T CAT A 3 660 

TAAAGAACTT AGATAAGTTC CGGACTCATA GAGTTCAATA AATGTTAGCT ACTAATAATA 3720 

ACTATATATT TTATAGATGA GCAAACTGAA AG TG AG GG AG GTTAAGTGAG ATGGCCAGGG 37 80 

CCACACAACT GGAGGAACTG GCCTTCAAAC CACGGCCTAC GTGACTTCTA AACAGATAAG 38 4 0 

CCCTGACTTA CAACCATGCC CTAACTTGCA TTCTTGCTCA AAAAGATTAA ACAAAAGTTT 3 900 

AAGTTCAGAA CCCAAAAGCA ATGACTTTAG AATTATGTAA TCAGGTATCC CTGAGATATT 3960 

AAAACACATA AGAATATTCC AAATGGGAGC AAAAGGTTTG AAT AC AT G AA AATCAAACTC 4 020 

ATATCAGCAG AGACCATATA AAGGGCTCTC ACTGCAGGCT GACTAGTTAG GAGGATGGCA 4 080 

AGGTGATCCA GGACCTGCGC ATGCTTTGTC AGTTCAAATT GAATCTCATG CCAACAGCGA 414 0 

TCTTTTTTAA CATGTAACAT TAGGTGTCTC AGGTACACAT GACCATAAAC CACACCTGGA 4 200 

GGGTTTCTTT TATTTTCTTT TTAATATTTT TCTGAGACAG GGTCCTACTC TGTCACCCAG 4 260 

GCTACCATGC CCAGCCATGG AGAGTTTCTT AAAGATACTG ATTCCTTTGG TTAAACCTGC 4 320 

CACCAAAAAA AAAAAAAAAA AAAAAAAAAA ATACTGATTT GTGGGCACTC CATCCCAAAT 4 380 

CTATGGAATC AAAATCTTCT GGGGGTTTTT AATAAACATC TCAAATGAAT CCTATGATAA 4 4 40 

GACAAATTTG GTAATTGTTA CACAAACACC TAATTTAAAA AT CT GAT CAT TCTACTATCT 4 500 

AAACACACTC AGAGTTAATG AGGGAGAAGG GAGAAATTGA TTCTTCTGTA AGACAGGTAG 4 560 

CTTTGCAAAA AGGAAAACAG CTTAAATCAC ATTCATTTCT TATTAAAAGC TGATGATTAA 4 620 

TATCATTTTA GTTTTTCCTG GGATGGTGAT ATAATATGGT GGTCATTCCT GTCTTAACCA 4 680 

AAGATATTTT TGTCCACTCT AGGTTCACAT GTAGATTTCA GCTGGAATTT TTTTTTTTTT 4740 

TTTTTTTTGC TCCCAGGTAG ATTCTTAACC TAAACAAGAA ATGTAGAAAT TACAGTTGGT 4 800 

CCTTGGTATA TGCAGGAGAT TGGCTCCACA ACCTCCCTCC CCCAGTATAC CAAAATCCTT 4 8 60 

GCATACTCAC ATCCCACAGA TTTATTGTCA GCAAAAGAGA TGAGAGTTAG TTTGAACAGT 4 920 

CTGCCAACAA TATGATTTGA TGAATTCTAG GAAGGTATTT TCTGCAGTAA AATATTTCTC 4 980 

CAACTATCCT TTTGCCAGTA TCTAAAATTT CAGATTAGAG ATAACTTCCT ATTCACTAGA 504 0 

AAAACTGGAT TAAAACCTGA TTAATTAGGC TTTATTGAAT ATTAAGGGTT AAGTATATAA 5100 

CTGTGGAACT TGTAACAGTA TCACATTTCA AATTTCTCTT AAAACTATAT CCAATAGAGG 5160 
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AATGTAAACT ATTGTCTCCA CTCAACGAAG TCAAAGAGTC CAAAGAGTCT CCCTGCAGAG 5220 

TGAAACATAA AATAAGCAAA ATTTCATAGG CTGCCTGCAC TACGGCTATG TGAGGGTTTT 528 0 

GGTTACCAGG TGACTGGGAG TTTCCAAGAA GGATGCTGGG AGCCCCATGC TCTTCCCTGG 534 0 

GAAACTTTGC CTTTTCACTA CTCTACCATC CAGAAGCAAT TTTTTAAATG GGTTATTTAT 54 00 

TAATTTTCGT ATTTACACAA CTCCTACTGA GATTACTTAA CATATTTGGT GGTGACAAGT 54 60 

TAACAATAAA TAAGTAAATT TAAGAATCCT TGTCCTATAC CCAACCCAGA CAATAGAGTT 5520 

CTTCCAGACT CTCCAGCACC CCCTAGTGGC ACATATGGAC CATGGGACGG GTAGGTAATT 558 0 

AGCATATATT TTTCGTTCTG TTTCCAGCAA CGGGAAGCAC TTGGCAAGCA TCACCTTCTT 564 0 

TTCTTCGCAA TACTGCTAGG AAGTATGTAT TATGATTATC TTTATTTACA TATTAAGAAG 5700 

AAACAGTTTT CAGATAAAGA ATTTGCTCAG GGGAACATAG GTGGCGGGAG AAAAAAAACG 57 60 

AGGGTTTACA ATTTCGGAGC TCTCACACTT AATAACCTTG CTGAAGTATT GATAGAGGAA 5820 

AACATGATCT TCTTTCAGCC GCTAACCTTC TCTGTTTCCT TTATTGTTCC TAATACCTTG 5880 

TATTCACGTG GGAGTTACCA TGTACATTTT TTTTCCTGTG GGTTTTCTTT TAATATTTGG 5 94 0 

ATTTGGATCT CCTCCTTTTC CAGATGTATA TGTTTAGTTA TTTTAATTTT CATGTAATAC 6000 

TCTCTAGACA TATCTCAATC TTGGTTTTCT TCCTCTAAGT TCAATCTGAA ATATCACTTT 6060 

CTCTCTTAAA TTTGGCTCCC CCAAGATCCA AC ATT CC AAA CATATTGCCA ATGAGTGTAT 6120 

ACCTTTTAGC TTGAAAGCAG CAGAAAAAAA GTGGTAAATA CCTGAGCCAG GGAACTTAAT 618 0 

TAGGGGGTTC TATCAGTGAT CAAGGCCAGT GATCAAGGGA GACACCAGCC TAATGAAAGA 62 4 0 

TGACAGAAGA TAGCAATACT CTAATAGAGA TGTGGTTCAC AAAGTTCATT GTGCAGAAGC 6300 

AGCTAGGGAG AGCTTCTAAA ATACAGAAAT CTGAGCCCGT CTTTTTTCTT TTCTTTTTTT 6360 

TTTTTTTTTT TTTGAGATGG AGTCTCGCTC TGTTGCCCAG GCTGGAGGGC AGTAGCGCAA 64 20 

TCTCAGCTCA CTGCAACCTC CATCCCCCGG GTTCAAGCGA TTTAGCTGGG ATTACAGCCT 64 80 

TGTGCCACCA CACATCTGGA CCCATCTTCT AATGCAACTG GTCCACTGAC TGGCATTTGG 654 0 

GAATTGCAAT TTTGCCTCTA ATTGTAGGAC AAGGAAGTAA GAAGAGTTTT AATCATATTC 6600 

AATTCAAGTA ATGGAGCAGA TAGATGTAAG GTCCATCCGA AAGAGTGAAA TGATAGAATC 6 660 

ACAGAATATT CTTAAAGAAA GGCAATTTTA TTCTTTCTAA CTGCTTATGG TAACTACCCA 6720 

TGAAAGCAAA AATATTGATT GGTAAGGGTC AATATAATGA TGTTTCACGA AGAAAAAGTT 67 80 
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TAATTTGTAA GTTTTTGTAA TTCACATTTA TAATAAATAA ATCTGTTTCT GCTTTATAAA 68 4 0 

TTTCCTCACT TGAGTAGATT AAATATTACC CTTATAATCT TCTTTAAACT TACTGTTTAC 6900 

AACCTTTTTA TTGTCATGAA GTCAAACATA AACTTCAATT CAGCTCGTGA T C AAAAG AT C 6960 

ATAAATTCTA AATAAGTGCT ATCTGAATTA ACTTGGTTTG CTAGAGTTTT CTGACATTCT 7020 

GAAAATTCTA TATTAGAAGA ATTCTTTATT ATATGATAAT TTATGTTAAA CAAATTATAG 7080 

CAAATTCTAC ACATAAGGAA ATTCAGACTA TATTTATGCT TAATTATCCA GGCAGTAGTA 714 0 

GTACTTAAGT AAATATGTGA GTTAAATTTA TCTGTTTTGA AAACTGTGCC TCTGTCCTCC 7200 

TCTTGATTGA CAATAAACCC TCTGTCTCCA CTTTCACATC TCCAAAGTTC AAGTGCATTT 72 60 

TAATACAATA TAACAATAAG CACCATAAAG ATATAAACTA TGTTTGTACT GTTAGCATCT 7320 

TATCCCTAAA TCCAAGCTCA GGCCCTGGTC AGTTCAAGCA TTTGATACAT ACTTGTCTAT 7 38 0 

TAAATCAACA TTAATCATCT CTTCATAACT AGGAAAACTA GGCCAATTTT ACCCAGATTT 74 4 0 

GTCTAAATAC ACAGATGCCT ACTTCAGCAA ACTAAATGTA GAAGGAAGCA CATATGAAGA 7 500 

GAAGGGGGTC TTTTTTAGCT GCTATTTACC AATTAACCCA AC AAT AAAAG TTTATCACTT 7560 

GGCTGGGCGC GGTGGCTCAC GCCTGTAATC CCAGCACTTT GGGAGGCTGA GGCAGGTGGA 7 620 

TCACCTGAGG TCGGGAGTTC GAGACCAGCC TGACCAAAAT GGAGAAACCC CAACTCTACT 7 68 0 

AAAAAT AC AA AATTAGCCGG GCATGGTGGC GCATACCTGT AATCCCAGCT ACTCAGGAGG 7740 

CTGAGGCAGG AGAATCACTT GAACCCAAGA CGGGGAGGTT GCAGTGAGCC G AG AT CAT G A 7 800 

CATTGCACTC CAGCCTGGGC AACAAGAGCA AAATTCTGTC TCAAAAAAAA AAAAGGGATT 7 8 60 

ATCACTTGAT CTTCAGAAAA ATAGTGAGGT CATTATTGTT TGCTGACAGA CTACACAAGT 7920 

AAAATCTCCC AAAGGCCAGT TTTGCCCTGG CCCTAAGATT ACTGTAGGGC CTCAGACATC 7 980 

AAATCAGTTC TTCTCATCAC TCAAAATTCC CTTAAAATTG ACCTGACAGA GAAGCCAACC 804 0 

ACATTTTTAA GCCAAATTGT TGGGTCTTTT AAAAACT AG C ATTTTGGCTG TAGTATAACA 8100 

GTCTTAGTTT AACTGATTCA AAACTATGGC TGGCTTAGTA AATTTAACGC TAGTGGCCAA 8160 

TAATAACAGA AAAGAGATAA ATATTCTTAA GTATGTATTT TGAGCCAGGG ATTCTGCTAA 8 220 

GTACTTTATT CACTCTCATT AAAGCCTTGA AACAATTGTT GCATGTTTAA GTTATTAATG 828 0 

AGCCCCATTT TACAGAGGAA AATGAGGAAA CTGACCTATG TAACTTGCTC ATGGTCACAA 8 34 0 

GCCATTAAAG GTGGCAGAAT TAGGATATCA ATCCAGTCGG TGTGACTCCA GAACCCTCCT 8 4 00 
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ATTTACTCTA TACTACTCAT AAAATTATTT GGTCTTGGGG CTGGGCGCAG TGGCTCATAC 8 4 60 

CTGTAATCCC AGCACTTTAG GGGGTTGAGG TGGGTGGATT GCTTGAGCTC AGGAGTTTTA 8520 

GACCTGCCTG GGCAACATGG TAAGACCTCA TCTCTACAAA AAAAAAAAAA AAAAAAATAC 8580 

AAAAAATTAG CCGGTGTAGT GGCACGCGCC TGTAGTCCCA GCTACTTGGG AGGTTGAGGT 8 64 0 

GGGAAGATCA CCTGAGCCCA GGAGGTTGAT GCTGCCGTGA GCCATAATCA TGTCACTGCA 8700 

TTCCAGCTTG GGCCACAGAG TGAGACCCTG TCTCAAAAAT AATAATAATA ATCTGGTCTT 87 60 

GAGAAAAAAT AGTATTTTTT TCTTCATAAA ATATTTTCCA TTTTGAGAAC TTGATTAAGA 8 820 

AACTCATTGT CTTGCCAATG ACATTACATT CAATCATGCT GAAACATCCA GAAATAGTTT 8 880 

ACACATCAGT TTGACATCAG TATTATGCAA TTTGAAGCCA CTGTTTGAAA ATAAAAACAC 8 94 0 

TGTACCGTGA TTTGTTTATC CAGAGTTCAG AT TAT TAT AT CCTTGTATAT GAGACAGAAA 9000 

CCCCCTTGTA TTCTAGTGCA AACTCTCTTT GGATCTTAAT ATGTATAGTT AACAATAATA 9060 

CCATACTACA TTCTAACTAC CTAGAAAGCT AGCATACCTT AACCTGATTA ACTTTTACCA 9120 

AGTTACTTGA AATTATAGCA AAGTTACCAT TTAAATCTTG ATTCTGGCCA GGTGCAGTGG 9180 

ATGAACCAAG CATGGTGGTG CCTGTAATCC CAGCACTTTG GGAGGCTGAG GCGGGTGGAT 924 0 

CACGAGGTCA GGAGATTGAG ACCATTCTGG TTAACACAGT GAAACCATCT CTACTAAAAA 9300 

ATACACACAA AAAAAATTAG CCGGGCGTGG TGGCAGGCAC CTGTAGTCCC AGCTACTCAG 93 60 

GAGGCTGAGG CAGGAGAATG CCGTGGACCT GGGAGGCGGA CTTGCAGTGA GCCAAGATCA 94 20 

CGCCACTGCA CTTCAGCCTG GGTGACAGAG CGAGACTCTG TCTCAAAAAA AAAAAAAAGA 94 80 

TTTGATTCTA TCAGTCTACT CACCTTTATA GCTTGACAAT GATTGATTTG TGTAAAAGGA 95 4 0 

TTCAAATCAA AATTTGCAAA CTCCCTTCCT CCAAAGGTAC TCATTTTATA ATACTGAAAT 9600 

TCTCTATTAT GTTCTCTGCC CAGTGTCCCA GGGTTTATTG GTTTCTAAAG AGGTAGTGGG 9660 

TATATACAGC CTCCCCAAGG GGAATTTAGG AAGTAAGCTG GTTGTCACAA AGACTGGCAT 9720 

TAAATAGGTA GAGACCTAGG ATGCTAATAT CTTGCAATGT GCCAAAATAA TTGTCCCTGT 97 80 

CCCCAACCTC ACCATTGCCA ATATTACCCC TACCCCTCAC AGTGAGCGTC ACAGGCAGGC 98 4 0 

AACAAACTGG TGTCGTCACA GAATGATTGA TGGAACACAT AGACTGCATT CATTACCTAA 9900 

ACATTGTCGT CACACTGCAG CAACCAAAGA CAATCGCATT ACCCAGGGGT TAGATGTAGG 9960 

AAGAGTAAAA AACAAAAAAT TTTTGAATGC GTAATTATCA CTAATTATTT TATTTGATCC 10020 
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TTCAGGAGAA 
GCAAAGAAAT 
ATAATTCTAA 
ATATTCAGTT 
ATATTTAGAT 
TAAGTATTTG 
TGGTATTATA 
TGAATAATAA 
TCACTCTGTT 
TTCCAGGCTC 
ATCACCATGC 
AGGCTGGTCT 
GGATTACAGG 
ATCATTGAAT 
GTTTTGTTTT 
CATTGGTCTC 
ATGCAATCTC 
TTTCCTGTGC 
TATCAATGGT 
ATTTCTTGGC 
AGGAAGATCA 
CTCTACAAAA 
TATTCTAGAC 
TGATTGTGCC 
ACTAACATTT 
TAGTAATTCT 
TTTGTATTTA 



TGTGGAAGAT 
GTCCTGTTTC 
ACTTCTGGAA 
CCAGGTATTG 
AG AAAAG T T A 
TTGAAATATA 
GATTATATAC 
TATATTGATG 
GCTCAGGCTG 
AAGTGATTCT 
CTGGTTCATT 
CGAACTCCTG 
TGTGAACCAC 
ACACCTAGCT 
CTTAGCTTCT 
TGTTCATACT 
TTACAACCTA 
TTCCTCAAAA 
CTATACTTTG 
CAGGTATGGT 
CTTGAACCCA 
AATTTTTAAA 
TGAGAAGGGA 
ACTGCACTCC 
CTGGATAAAT 
AATACTAGGC 
TAAATTCCAT 



GGCCGAGCAA 



AGTGACTTTC 
TATTTCAGGA 
TATTTTTGGG 
CTCTGATAAT 
ACAGCCTCAT 
ATTAATTGAA 
TCAAAACTTT 
GAGTGCAGTG 
CCTGCCTCGG 
TTTGTATTTT 
ACCTCAAGTG 
CACACCCAGC 
TCATTTGCCT 
TCATAGAAAT 
AGAAGGCTGT 
AAGATGGCCA 
TCAACAAAAA 
AGAAATAGCT 
GATTCATGTT 
AGAGTCTGAG 
AGATTATCCA 
GGATCGCTTG 
AGCCTGGGCA 
AACTGTTAGT 
TTATATAATA 
TAAAATGTCC 



GTATCTATCA 
CAATGCCTGA 
TTTTTGCTAA 
GAAATGGGTT 
GAAAGCAATT 
ATAAAACCCA 
GAGGAAAATC 
T? *T T r ^ ^* T T *T T T 
GCATGATCTC 
CCTCCAGAGT 
TGGTAGGGAC 
ATCCACCCGC 
CTCAAAAATT 
TGAAAGGGCG 
GGGATTTCTT 
GGGAAGTATT 
GATCATTTTG 
GCAATATTTT 
ACTATGCTTA 
TGTAATCCCA 
ACCAACCTGG 
GGCATGTTGA 
AGCCTGGGAG 
ACAGTGTGAG 
GAGGCTTATT 
TCAACTTACA 
AGTTCTACCT 



ATCTGTCGTT 
AGATTTTCCA 
AAAATTTGAT 
TCTCTGCATT 
ATGAATGAAG 
AAAAGTAGTG 
ATCTGTTAAA 
TTTCTCCCTG 
AGCTCACTGC 
AGCTGGGATT 
GAGGTTTCAC 
CTCGGCCCCC 
CATTTAAACT 
TATACCAAAA 
AGATGTGTAT 
TGCTTATCAT 
AAAAACACTT 
AATTAAGCAT 
GAAAATAAAA 
GCACTTTGGG 
GCAATACAGT 
TACCCACCTG 
GTCAAAGCTG 
ACCCTGTCTC 
TTTAATACAT 
ATAGTAAATT 
AATGTAGTTT 



. AC _CAACACCA_ 
AACTTCCTGC 
CTGCTAAAAT 
AGTTCAGCTC 
TATCCCATTC 
TCATTACCCT 
ATTAAAGGTT 
AGACAGAGTC 
AACCTCTGCC 
ACAGGCACAC 
CATTTGGGCC 
CAAAGTGCTG 
AATATCTGTT 
TTAAATTGCT 
TAAATAAATT 
TTTTTTCTGA 
GGAATTACCT 
GCTGAATTTT 
TATAAATCAC 
AGGCTGAGGC 
GAAAATCTGT 
TGGTCCCAGC 
CAATAAGTGG 
AAAGTAAATA 
GTCATTTTCT 
TTGGTGAAAA 
TTCACCAATT 



_10080_ 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
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CCTGGTAGAT CTAACTTGTG AATAACAGAT TATGTATACC AGAAGGTTTT GTAACTTTGT 11700 

GCACTTAACT ATCAATCTAC TTAACAAATA TATTGCCTTT TTATGATATA TAACTTCTAT 117 60 

TCCATTCTTT TAAAGATCAT GTTAGAGTCG CAAGGAAGTC ATTTCTCTTG GTTATTGTGT 11820 

TACTGCTACT TTTGTTTCTT GGAGAGTGAA GAGGGGTTGG GAAGAAAGGT TTCTGTTTAT 11880 

TGGTCTCTGA GTTGGTGTAA GTCATAGGTG TTAGAGCTCA ACTCGAGAAG CAGGCAAACT 11940 

GTAACAAGCC CTGTTGCTTA TGATTGTCAA TGTAATCTAC ATCAGTGCTT CTCAAACTTT 12000 

AATGTGGACA TGAATCACCT GGATATCTTG TTAAAAATGT AGGTTCTAAT TTAATAGGTA 12060 

TGGGGTAAGT TCTGAAATTC TGCATTTCTG ACAAGCTTCC AAGTGATACT GAAGATCCTG 12120 

ATCCTCAAAT CACATTTTGA ATAGCAAGGA TCTACAGCAC TTAGTTAATA TACTACTTTG 12180 

AACTACCATC TGAAATCTTT TCTTTCATCT GAAAACTGCC CAGATATTTA AAGCCCTTTT 1224 0 

ACAAGATTTC TACT AAT ATT CCATATACAT TTTTAAATTG AGACAGCTTA AAAATTACCA 12300 

ACCCAGCAGT TGGAAAAATA TCTGAAAATT TGAGATATAT AAAAGACTAA AATACTTGCA 123 60 

AATGAGAAGC ATGCCATTCC TCTAGCATTA TAAACTTTGC TTCCACTTGA CATCGTTTCT 12 4 20 

TAATCCAGCA GATATGAAAC ATTTATGTAC AATTTTAAAA ATTAACAGAC CTCCAGTGAG 12 4 80 

CTACATTTAA AAAAATCAAT GAACCAATAA ATCATTTTAT TCAAATAAGA TCATGAACTG 12 54 0 

TCTTGCTCAC AT GAT G TACT CTGTTTTAAA AAT AG C AAA T GTTAAAAACT ATCATTCAGT 12 600 

GGAATGCTGA CCATGTGTCA GGCACTCTGC AAAGTGTTTT GCGTGAAATA TCTTCTCTAA 12 660 

TACAAAGTCC ACAAAGAGGC GGCTACATAA AACGTTCCTG ACATATGCCA ATTGCATGAT 127 20 

CACTTGAATT ATTGGTTTGT TTCCTTGTTC AGATTATCAA ATAACAAACA GAGAGAAGTT 12780 

CTTTAAAAGA AAAGATATAT ATTTGGTGAT AGAGCATTGT AATGAGAATG TACATGCCAT 128 4 0 

GGTAAACTAT TTGTGTATTC AGGGAGTTAA AGGAAGACAA AGGTTTTTAA ATGGGGAAAA 12 900 

AATACAATTA CATAATTGTT TTGAAATAAT TATATAAAGA GCAATAACAA GGGTGATGCC 12 960 

AGTCTGAGAT TGGACAGTTA CTGAGCAGAT GTTCTTGTAG AAGTCATTTT TGTGTAAGAT 13020 

TATGATGGTC TTTGTGTAAG GTGGTGGTTT TTGTAGTTTT TGTTATCAGG CACACATCAT 13080 

GAGAACCCGC TCTTTCTGGC CTTTCCCAAT TCTATTTGTC GGGTTTCTTA ACATTAGTGA 1314 0 

CTCCATCTAG ATTCTGACAG TTTTCATGAG AACTTGCTTT TCTTTTCTCT CTCAAGTCCT 13200 

TATTCAGTAT TCAGCACCCT TAACAGATTA GTCCCACTGC TGAGTCAGGC CTCTTGCATG 13260 
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AAGCAGCAAT GAGAAAGACA C AC TTGGC C A AT GT TAT C C T GG AGTAATTC_ .TCAATGATGC __. 1 332 0_ 

CTTCTCTGTG TTTCTTCAAG ACAACTGTCC TTAGTGTGAG AAAATGTCCA GATTTCTCAT 13380 

CCTCTGGCCA ATGGAAGGTT GTCACTCAGA GCAACGGCAA GGAGCAGAGT GCTGTCTTTG 13440 

ACGCAGTTAT GGTTTGCAGT GGCCACCACA TTCTACCTCA TATCCCACTG AAGTCATTTC 13500 

CAGGTGAGAC CCGCTGGGAT TCCCAGCTTT TTGGAGTAGG TTTCCAGGTA CTTTATATGT 13560 

AGTTTGGATT GACAAGCAGG ATTCATTGCT GCAACTGGGC AGAACTTGGC TCAATAAGAT 13620 

T GAG AC AG AG CTAGAAAGAT GAAAGACACC AAACATCATC TTTGTTTCTA TTGGCCTCTG 13680 

AGTCTTCATC ACACATAGAT CTCAGAGCCA ACTTCCTTGG AAGTCACTAA GTCCTTGGCA 1374 0 

TAATTTTAGA GAATTCACAT CAAACTGGTT CTCTGTTGGA GAGGCCCTTT TAGCCATGTG 13800 

CCTGCGTTGG CCTTTTTCTA CCCTGCCAAA CACCGAGCCT TTTTCACAGG GCCATACTCA 138 60 

CACACAAGGG GAGAGCTCCT AGAAAGAAAT GCTTTGCAAG TTAGTGATGG GGAGAGAAGT 13 920 

GCAGGAATAG AACCCTGCAT CCAGCTGTTC TGGTCCACCC AAGTCTTTCC TCAGAGAACA 13980 

CACTTCTTTC CCAAGGCCCT TAGGAAAATA TGTAATATAG TGGTTCATAG TCCAGGCCTC 14 040 

ATATTAGAAT CACCTGGGGA GCTTCTAAAG CCCTGATGGC CTGGAGACCT ACCCCCAAAG 14100 

ATTCAAACAC TATGGAGTAG GGTTAGAGCA ATGAAAGTTT GCTCAGGTGA TTTTAATATA 14160 

CAGTCAGGAT TAAGGCCTGC TCATCTAAAG CAATTGTTCT CAAATAGAGT CACCTGGAGG 14 220 

GCTTTTGAAA GCACAAATTG CTAGGCCCCA CCCTCCATAT TTCTGATTCA ATAGGTGCTA 14 280 

TGGCTTGAAT GTCCTGTCCA AAACTCATAT TGAGATTAAT CCCCAATGGG GCAGTATGAA 14 340 

GAGGTGGGGC CTTTAAGAGG TGATTGAGTA GTAAGAGCTC TGCCCTCAAG AATGGATTAA 14 400 

GCCATTTGTG GATAAATAGG TTAATGGATT ATTGGGTTAC ACAGGAGTGG AACTGGTGGC 14 4 60 

TTTATAAGAA GAGGAAGAGA GACCTGAGCT AGCATGTTAG CATGCTTGGC TCCCTCACCA 14 520 

TACAATGCCC TATGCTGCCT TGGGACTCTT CAGAGTCCAA ACCAGCAAGA AGGCTTTCAG 14 580 

CAGACGCAGC CCTTCAACCT TGACTTCTCA GCCTCCACAA TTGTGTGCCA GAAGAAATAA 14 640 

CTTCCTTCCC CTATAAAATA TTCGGTTTCA GATATTTTGT TAAAAACAAT AGAAGACAAA 14 700 

TTAAGACAGT AGCTCTGGCA TGAGGCTGAG AATTTGCATT TCTAACACCA GGCAATGCTG 14 7 60 

ATATTGCTGG CCATGTGACC ACACTTTGAG AACCAATAAT CTAAAGATTC TTTCAAGCAA 14 820 

CCCCACCATC AATGGCAAAT ACTTTATAAA GTCATGTGTT TCCGTGAAGT GTAAAAGTAG 14 880 
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TAACTAGGAA AGGACACAGA AGAAGCTTGT CTGTGATTAA CCACCAGCAA GTCACTGATT 14 940 

TACACAATAT GGAAACCAAC TCCTATGTGC CTGGTTTTTA GTTTTAGTTT TTGTTTACTT 15000 

TTTGAAAATA AGATTGCTAA ATTGTATTCT AACTATTACA CAATTATAAT AATAGCACTT 15060 

CATAATGTGC T TAAGAAAT A TTTAAGAGTA TCTGATAAGT GATTTTTTTT TTTTTTGAGA 15120 

TGGAGTCTCA CTGTCACCCA GACTGGAGTG CAGTGGCACG ATCTCAGCTC ACTGCAACCT 15180 

CCACAACCTC CATCTTCCAG GTTCAAGCAA TTCTCCTGCC TCAGCCTCCC AAGTAGCTGG 1524 0 

GATTACAAGT GCACGACCAC CCCTGGCTAA TTTTTGTATT TT TAG TAG AG AGAGCTTCAT 15300 

CATGTTGGCC AGGCTGGTTT CAAATTCCTG ACCTCAGTTG ATCCGCCTGC CTTGGCCTCC 15360 

CAAAGTGCTG GGATTACAGG TGTGAGCCAC CACACCTTGC CTAATATGTG ATATTAAAGG 154 20 

GTCAAATGTC ATTATATAGT CCAAAATAGT ATATAATAGG CAGGCAGAAG ACAGTATCTG 154 80 

GTCCTGCTGT GTTCATCACC ATTTATTTGT CTCTGATAGA GACAAACTGC AGCCGTAAGC 15540 

TGCAGCCTCT GAAATAAAAA ATCAACCCCT TTGGTCCTGT TTTTTTGTTT GTTTTTTGTT 15 600 

TTGTTTTGGT GTTGTGACAG TCTCACTCTG TCACCCAGAC TGGAGTGCAG TGACTCAATC 15 660 

AGGGGTCACT GCATTCTTTA CTTCCCAAGC TCAAGCAATC TTCCCACCTC AGTCACCCGA 15720 

GTAGCTGGGA CCACAGGCAT GCACAACCAT GCCCAGCTAA TTTTTGTATT TTTTGTAGAT 157 80 

ACAGGGTTTC ACTATGCTGC TCAGGCTGGT CTCAAACTCC TGGGCTCAAT CAACCTGCCT 1584 0 

AGGCCTCCCA AAGCGCTGGG ATTACAGGCC CCACCTGGTC TGGTACCTAA ACTTTCTTAT 15 900 

GTGCTTTACT CCTATAGAGA AGAGGCAAAA CAATTATTAA CTCCAGAAAG GAAAAGCTGG 15 960 

CAATGCAGTT TTATTGAAAT TAGCTTGACA TAGTTGCTCT GGAGCTCACA GACTTCTCTC 16020 

TTCTTCCCCC TGAAGGTATG GAGAGGTTCA AAGGCCAATA TTTCCATAGC CGCCAATACA 1608 0 

AGCATCCAGA TGGATCTGAG GGAAAACGCA TCCTGGTGAT TGGAATGGGA AACTCGGGCT 1614 0 

CAGATATTGC TGTTGAGCTG AGTAAGAATG CTGCTCAGGT GTGATGCTCT CTGCTTACCA 16200 

TGTACCTGGA GGGGAGGAAG TGGGGATGCC ATACTGGAGA ACCCCAGCCA TATAATCGCG 162 60 

GCTCCAATCC TCATTAACTA GTTGGTTGGT AGCGCATTGT GGCATCATAG AAAATCTGGA 16320 

AGTCAAGAAA CCACTTTACC TCCTAGCTCT GTCACTAACC AGCCATGAAT CCTAGAGTGA 16380 

TTCATTTCAC TTCTCTGGGA GATGGCTCCC TCATTTTTAA AATGGGAACT TTTGACCAGA 16440 

TGATTTTCCA TATAAGAGGC CTTTCATCAA CATGGCTCAC TGCAGCCTTG ACCTCCTGGG 16500 
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CTCCAATCTT CCTGTCATCT CAGCCTCCTG AGTAGCTGGG ACTACAGGCA CATGCCACAC 165 60 

CACACTCAGC TAATTTTCAT ATATTTGTAG AGATGAGGGT CTTGCCATGT TGCCCAGGGT 16620 

AGTCTAAAAC TCCTGAACTC AAGCAATCTG CCCGCCTCAG CCTCCCAAAG TGCTGGGATT 16680 

ACAGGCATGC ACAACCACAC CCAGCCAAGA GGCCTTGTTT CTACCTGGAT GTTTAATGAG 16740 

AGGTTAATCT GTTCATATTC TGGAGGGTGG CTTTTAGAAA TTTAGTGTGT ATTTGAATTA 168 00 

TATTTGAAAT ATAGATAACC TTCAGTTACC CAAATATTAT GAAAAGAAAG ATTAAATAGA 168 60 

TAGTAGGTCT CTCAACTAAA AT CAT AG AT A TTTAGGTGCT TCCTGAGGCC TTCTAACCAC 16920 

TGTCTTCTTT GCACCTGCTC AGGAATGACA CCAGCTGAGC TGCCAAAGAG TCAAACATTC 16980 

ATT AC AT GAT GATGCTGCTG ACAGTGGTGG TCAGGAATAG CAAAAACTAA ACTCCTTCTG 1704 0 

CAAGGACAGA CCTAGGCAAA GAAGGGAAAA TCACTAAACA TCCTTTCCCA AAGTATTCCC 17100 

TCTCAAGAAG GCCTGAACCA GATGCCCAAT CACTCTTACC CTAGCTCTTT CAGCCTGATG 17160 

TCTCTGGCCA CCCAGGGCTT ACCATGGCCC TGTGCACAAC CAACAAATCA TTTCCATCCT 17220 

AAGTCTTACA CTTTCAGGAC TCTAGATACC CAGTGGCAAA AGTTACAAGC AAACATGACA 17280 

CCCGCCCAGC AGGTTAATGA AGGGGTTATA CTGGGACCTG TCAGAGTCAT CTATCAGTCA 17340 

GTTAGTTAGT GCCAGCCCGG GAACAGAGCA GGTCACTAAC ACCGGAAAGA GACTTACTAG 174 00 

ACCCAATAAG TCTTCACTTT GTGAAAATAA ACCTCTTGTC ACTTATCACC TCAGTGTGAA 174 60 

GAACAAGTGA GGAGGCAGGA ACTGTGACAG CCTGGAGAAG AGCAGAGCTG GAAAATGAGA 17520 

GTACCAGCTC TAGGCTCTTT CATGCTACGA ATACCCGCAA AGCCTTAGGA ACAGAGTGTA 17 580 

ATGGGGCAGT ATGTGAGGAG CTAATATAGC AGTCAGCCAA GTGAAGATCC ATCCTAGACT 1764 0 

ACTTCACGTT GTCAGACCAG TGATTTGGAT TTAGATCTCT TCATTCCAAA GATATCAAAT 17700 

CTTAGATGGC AAGAACCAGT TCCTTGTATG GGTCTTGCCC TACAGGAAGA CTTATGGTGT 177 60 

GAGATTCAAT ATTAAGAAAC TACCTTGGCT CTATTTGCAT GCCTTACAGC TTCTTAAACA 17820 

ATCTTTTGCA CAGAGTGCAA AAGACTTTGT TTCCATCTCC CTCTATCAGT GTAAATGCCA 17 880 

CTAGATGCCC CCTTTTTAGG AGGTACTTCA CTTTGAGGTC AATCATCTTT AAAAC AG AG C 17 940 

CTCAGTAAAT TCTGGGGCTA TGCATGTGAT ACATCACCTA CATAATAGAT TCCTCCTAAA 18000 

TATAATGTTA T AAT CAT AC A TTTCCAGGAT TATACTCATT CATCTGCACT AATCTCTTCA 18060 

ATATTTATTA GAGTAACAAC ATAAATCTAT AACTATGATA AAACCTCTTA CACAGAGTAA 18120 



DOC ID: <WO 982491 4A1_I_> 



WO 98/24914 



PCT/FR97/02226 



61 

TATACTCTCA AGCCTTCTGT GAAAAGACTA ACCAGAGACT TTACAGGAGC TATACATGCT 18180 

AGGAACGGAA CTAGGCGCAT CTGCAAAACT TGAAATTACA ACCTGAACTC ACCAAAATTC 18 240 

TGAGTGTGCA CTGCTCTGTT AAAAGAAATT CACCTTCATA AGGTTACAGC ACCCTCTACC 18 300 

ACAATCCAAA AGCACCACTC AAGATCATAT GGGATGGTGC TGCATCATTG TATTAGTCCA 18 360 

TTCTCAACGC TGCTATGTAG ACATACCCGA GACTGGGTAA TT CAT AAAG A AAAGAGGTTT 18 4 20 

AATTGACTTA CAGTTTGGCA TGGCTGGGGA AGCCTCAGGA AACTAACAAT CATGACGGAA 18 4 80 

TGCACCTCTT TACGAGGCTG CAGGAGAAAG AATGAGAGCG ACTGGGGAAC CCCTTATAAA 18 540 

ACCATCAGAT CTCGTGAGAA CTTACTCCCT ATTAGGAGAA CAGCATGGCA GAAACCTCCC 18 600 

CCATGATTGA ATTATCTCCA CCTGGTCCTG CCCTTGACAC GTGGGGATTA TTATAATTTA 18 660 

AGGTGAGATG TGGGTAGGGA CACACAGCCA AACCATATTA GTCATTTACA TACTTCTGAC 18720 

CAAAAACCAA ATCTCTGGCC TTTGACCTAA AACATGCGTC TC AG AG AAAG CAGCCTGAGC 18780 

CTAAATCCTC ATGTTTCTCT CACTGTTGCA GCTAGTGTCA TTAAGGCAGG TTAGACCACC 18 84 0 

CTGCTGTAGG GAGGGTCACA ACAGAAAAAG AGTGAATCAA ACGGGCAGAG CATACCATTT 18 900 

GAAACATGGT TTGCTCCTGA GAAAGAAGAG GGGACAGTAA GTAATGGAAA GAGACACTAA 18 960 

TGAAAATATT TTTGTATCTA ATATCTAATC AAAGTATTGC CAAGTCAGCC TATAAGGGCA 19020 

ACGGCAGGAG AAATTCAGAA CATAGGTATA TACCACACAC AGACCAGCAA TATAGGAATG 19080 

CTTGGTATAG GTGCTACTTC ACAAGCTAGG AATGTAAGGC CCATCCCCAC AAAATTTGTC 1914 0 

TCCAAATTCT GGTTTACTCC AGACATAAGG CACTGTATGA AACTCCTCTC TTCCAGCCTA 19200 

ACTTTATAAC TTAACAGCTA GCAGTACTTA TCACTTGCCA GGCAATATTT CAAGTACTTT 19260 

ATATATACCA CCTCATTTAA TCTACACAAG AATGCCATGA GGTAGGTACT GTTAATACCC 19320 

CCATTTTACA GAGAGAGAAA CTGAGGCACA GAGAGATTGA AATAATTCAA CCATGGCAAC 19380 

ACAGATTGAA ATAGTTCACC CACAGTAGTG TGATTGGGAT TCAAACCCAA GCAGTCTGTA 19440 

TCCAAACCTC TCAAGTAAAT TGGTTACCTT GCAAGTGAAT CTTATGTGTT TATCAAGTAT 19500 

AGCCTTAAAC AAAAACTTAT TGCATGGTAT GTAAAAATTT AAGAAGCAGT TCAAGTATGC 195 60 

ATTTGGCCAA TGGGGGAGTA ACAGCAAACA CAGCAAAATA TACATTTGAA AAGAGATTAA 19 620 

ATGTACATTT TGGAAACAAG GGAAATCTTA ATAAACAAGG TAAAGAATAC ACCTGAAAGA 19 680 

GGATTCAGAT GTGCACTTGA AGAGAAAGAG AATCACAGTA TAAGTTCAGA GTTTTTAACT 19740 
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TTTAAAATAC AT T ACAAGCA CTGTGTCTCA TGCCTGTAAT CCCAGCACTT TGGGAGGCTG 19800 

CGGCAGGAGG ATTGCTTAAG CCCAGAAATT TGAGACCGAC CTGGGCAACA TAATGAGACC 19860 

GTCTCTACAA AAAAATTGTT TGAATTAGCT GGATGTGGTG GTACATGTCT GATACTGAGG 19920 

TGGGAGGATC ACTTGAGCCT GGGAGGTCGA GACTGCAATG AGCTATGACT GCACAACTGC 19980 

AGTCCAGCCT GAG T G AC AG A GCAAGACCCT GTCTCACACA CACACACACA CACACACACA 2 0040 

CACACACACA CAAAATAAAG TCTTTTAAGT ATGGAAGGAA GATTATTTCC CCTGTTATTC 20100 

TCCATCCAGG GATATTCAGA TGCATATACA CTTATACTTG TGTAGTCACT AGGCTATAAT 2 0160 

CGCACATTTC CAAGGATTAT AATCATTCTA CCTGCACTAT AGAAGAAACT TAGGTGAGTG 2 0220 

GAAAACATGA GAGGAGGGAG GGAGGAACTT TCTCTTAAGG AGCAGCAAAC CACAACTGTA 2 0280 

AACATGGGAA AGACTTGTGG ATTTTATCAT CAGAGTTAGC CCAAAGACTT TCTCGTGTCT 2 034 0 

CCATGAAGTT CTCAAGATTT TGTTGCAGTC TTCCTGCATC AGTGTAAATG CCACTGGGTA 20400 

CCCCTATTTA GGAGGTACTT TACATTGAGG TCAATCATCT TTAAAACAGA ACCTCTGTAA 20460 

ATTCTGGGGC TACACATGTG AT AC AT G AC C TTCATAGTAG ATTCCTCCTA AACGGGACAA 2 0520 

TGCCCTAATT TAAACTGCAT TTCTTTTTGC TTGCCAGGTT TTTATCAGCA CCAGGCATGG 2 0580 

CACCTGGGTC ATGAGCCGTA TCTCTGAAGA TGGCTATCCT TGGGACTCAG TGTTCCACAC 2 0640 

CCGGTTTCGT TCTATGCTCC GCAATGTACT GCCACGAACA GCTGTAAAAT GGATGATAGA 2 0700 

ACAACAGATG AATCGGTGGT TCAACCATGA AAATTATGGC CTTGAGCCTC AAAACAAGTA 207 60 

GAGTTATTTT GCTTTTTTAA TGGTATACTC GTTGGTGAGC AAAGTTGTCT GAAGGTGTCT 20820 

CCCTTAACAA AG AT TCAAAT TGCTAACACG G TAG T T AAAA CTACAATCTA ACAATATGAG 20880 

TATCTTATAG GTCCTGGAGT TTAGCTTCTA AATTTGGTCT GTATGCCTTT AAAAAATACT 2 094 0 

TAAGAAGATG AAGCAGAAGT GTTATAAGCT GCTCCAGAAA GCAAAACTAG GGGAGAACTT 21000 

TCTAATACCC AGAGTTATCT AACATTGGAG £AAACTGTTT CAAGAGATTA CGACCTGCCT 21060 

TTCAGAGGGG TGTGGTGGGA AACATGTAAT TCTCCATCTA ATAATTTATG CTTTGCTAAC 21120 

CCTATAGCAT GAAGGTTCTT CCCATGGGAA ACCTTTGAAA ACACATTCCT TTTTCTTTGC 21180 

TAAAAGACAA ATCTCTGTTG ACGTCAAAGT TATATGTCAG TGATTTAAGC ACAAGCAAAT 212 4 0 

GTTATGAATG GTTCTTTTGC TTTAGTTGTT ACAGGCTTCT TCCCTTAAAA AAACAGAAGA 21300 

GCTTTAGAAT CTTTTAACAA ATGCCTGCCG TGCAACTACC ATATTCTAAG ATCTGACATA 21360 
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AGTGCCACGT ATCGTCTATT AAAAAAAGAA AAAGAAAATG TTCTCAAATC TACAAAAAAA 214 20 

ATAAGCGGAC TTTGCATCAA CATCCATGCT ATTACTAACA GAGACTCCAT GGATATTTGG 214 80 

GATTAACAAA TATCACCAAA CCTAATTTTA TACATTAATT TTCACATTGA TCCCTTCATA 21540 

GATTTCAAAA CTAGTGGAAA TTTAGCAAAT TTTTTCTTAT GATCAAATAG GGGTTAAATA 21600 

AAACAG C AAA ATAATAAAAG CTAGATAGCA TGAAAAAGGT TAAAAACAGA AATGGTATAA 21660 

TAACCACCAT AATACTTGGG GAT TG AC CAT AGGCACAGGC ATTTTGTCTA AGCCCTTGGG 21720 

GATGCTTCCT TCCTTAAAAT CTCTTTCACT CACGTTGCCT ACATGTTTTC CCTTATTTAT 217 8 0 

TGACAAGAGA TATTTGTGAC AT G AG AAT T A AG T C AG AAAA TAAGGATTTG CACAGACAAC 21840 

CAGTTAAGTT AGAGTTTTAC AGATATTTGA AAAGCCCTTT TATTTTCAGA GCCGTACCCC 21900 

AAAAATATCA AGAGGGTTCA AGATTCCTCA GCAAATGATC CTTCAGAATG TTTTTCTTCT 21960 

GTATGTCTCA GATACATTAT GAAGGAACCT GTACTAAATG ATGATGTCCC AAGTCGTCTA 22020 

CTCTGTGGAG CCATCAAGGT GAAATCTACA GTGAAAGAGC TCACAGAAAC TTCTGCCATC 22 080 

TTTGAGGATG GAACAGTGGA GGAGAACATT GATGTCATCA TTTTTGCAAC AGGATATAGT 2214 0 

TTCTCTTTTC CCTTCCTTGA AGATTCACTC GTTAAAGTAG AGAATAATAT GGTCTCACTG 22200 

TATAAATACA TATTCCCCGC TCACCTGGAC AAGTCAACCC TCGCGTGCAT TGGTCTCATC 222 60 

CAGCCCCTAG GTTCCATTTT CCCAACTGCT GAACTTCAAG CTCGTTGGGT GACAAGAGTT 22 320 

TTCAAAGGTA AGTGTGTAGG CAGGTGAGTG GCTAAGCGTT TCAGATCTGG TGAAGTTTAT 22 380 

CAATAATGAT AAGAAGGTTG CCTGAGATAA AAAGGTTGCC AAGAAAAAGT TTGACAACCT 224 4 0 

TGGCTGCTCT CACAAGACTA AC AT T C T AAA AAGTTACTGG AGAATTCAAA GAATAACAAA 22 500 

TACAGGAATT TAGTAATAAT AAATACCTGC AATCATCCTT TTAAAATATT AGACAGTCAA 225 60 

GAGAATTTCA ACTGGCATAA AGCTAAGTGC ATGTTAACTT TTCTTTGAAT CGTGAGAGAT 22 620 

AAGTTTAAGA AAAAGATCTG TCTCCTGGTT TTACCTCTGT GTTGTTTAAA AATTCCTCAG 22 680 

CATATCTGCA AATCAATTTA ACTCTTAATA CTTGAGCAGC TCAACCTCAC AAATCCCTAC 227 4 0 

AAGTTATAAA ATTATTAAAA GGTTTCTTTC TGGGTGTCTG TGTAGCACTT CATACTCCTC 22800 

AGAACGGTGT TACCTCCCTG CCTCCAGGGT TCAATTCTGT TCAGCAAAAG CTTACTGAAT 22 8 60 

ACCTTGCCCT GTGCTGGGAA CTGGTGGGAC AGAGAGAAAT TTAAACAGAT CATTTCAACA 22 920 

TAACATGACA AATGCTTTGA TTGAATAATA TATGGAGTGT TCAGGGAAGG AGAGAAAGGG 22 980 
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CACTTATCAT GGTAGAATAA GGGAAGGGCA CATGATAAAG GAAAACGTCC TGGATAAC TG 2 3040 

CATTTCTCAG GGGCAGAAAA GGGGATTGCC TGAACAAAAG CATAGAGTCA ATGATGCATA 23100 

TGGAAGGGCA CATGCTATTT GACATTGCTA GAGCATGACG TATGAGGCAG AG AG AG AT G A 23160 

GCCATTACTC TTGGAGAAGA AGGAGACAGG ACACAGGAAT TTTTTAAGAC ATGCTATGGA 2 3220 

GCTTAGATTA TAAATTATAG ATCAGTTCTT CCCAAATATG GCTACATATG AAAATCATCT 23280 

GATGGATCCT TAGGGACCCT GATTAAGTAA GACTGGCCAA GGGACCTGGA ATCTGCATTT 2334 0 

TAGAAAGCTC TTCAGCCCGG GGCACCAATG AAGGGTTATA AGCAAGGAAC AGGCATTAGC 234 00 

AGATTTACAC TTCAGATAGA TTGTTTCAGC AGTAGTGTGG AATATAGATT TGAAAGTGGG 234 60 

GAAAGACTAC AGCCTCAGGG ATGAAAGAGA AAGCTACTGA AATAGCCTAT GCTAAAATAT 23520 

GATGCATCCT GGGCCAGGGC AGAGATACAA AGTGGAAAGG AAG CC AT AAA TGTGAGAAAT 23580 

CATTAAGGGA AAAATCAGCA TGACATTATG ATTGGTTCAA TGTGGGAAAG TCAGAGAAAT 23640 

AG AG AG G AAT CTAGGAGGAC T T AC AG AT C T CTGGCATTGG AAACCAGGTG GACAGTAGTG 23700 

CTGTGAATAC AGAGGGGGTG TGCAGAAAAT GATGCAAGTC TGGACAGGAG GGCTTCAGTG 237 60 

AGGAGCTCAG GTCTGGACTA CTTGAACATG AGATGTCTGA TGACTCTAGG CAAGGGGACT 23820 

TGACCATATT TCAACACATC CAAAGCTCAG GGGACACTTG TGGGCAGGCG ATGGAGTCAT 23880 

GAGCACACAG TAATAACTTC TGCATCAATC TTTCCCTATC TCTACTGCCC TACTCTCATC 23940 

TCTCACCAGG TTTATTTCAA CAGCCTCTTT ACTGGTCTCC CCAGCTTTGG GCTTGCCTCC 24000 

CTGGAGTCCA TTTTCCTAAA TTCAGCAGCC AGACAGATCT TTCCAAAAAA TAAATCTGAT 2 4 060 

CTTCTCACTT CATTCAGAAT ACTCTTCCAC TGATTTGATT TGGGGCCTCC TGTCACCTTC 2 4120 

AGGATAGAGC CCAAACCACT AGTCATGGCT GCCAGGCTCC CAGACACACT TCCCTTTTCC 24180 

AGCCTCTTCT CTTGGCCCTC TCCACTTGTA GTCCATGCCG TAGACTGTGC ACCCTGGACA 2 424 0 

GTGTCACATA GAGTGCTATG GGGGTGGCAC CCCCTGAAGT TCAACAGCAC GGAAGCCCTG 2 4 300 

ACTGGTATGA CATGGTTCAA TGTCCAGAGT TTAATTTTAA GAATCAACAA CTAGACAAAG 2 4 360 

TAATGATATT GACTCAAACT TACTATTCAA ACCAACCTTT TATTCCTTAG GCTTGTGTAG 2 4 420 

CCTGCCCTCA GAGAGAACTA TGATGATGGA CATTATCAAA AGGAATGAAA AAAGAATTGA 24 4 80 

CCTGTAAGAA TTTTTTTTAA TTCTTTACAT GAAGCAGTGT TTCTCAAAGT ACAGTGATCT 24 54 0 

AACTACTTAC AAGAACCACC TAGCTGCCTG ATAAAATGCA AATTTCTGGG CTATAGCCCA 24 600 
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GATGATTGAA TCAGAAACTC CGTGTGTGAG GCTAAAAAGT TGCATTTTTA TCTTCTTCCT 24 660 

AAGCGATTCT TATACATACT AGGTTAAGAA CCAAATACTT AAAGATAAGA ATTGTACCAA 24 720 

ATCAGAGCAC TTCTCCTTGG CTTAATTTCA TTTCAGTTTT ATATGATGCC TATGTCAGAT 24 780 

TCCATAACTT CTCAAGCCAC CTACACTCTG TGGTTAGAGA GGGAATGGGA TGAGACAGTG 24 840 

GTGGTGATAG TAGCTTGAAT AGCTGTGAAA AGTTAGAGAA TCCCCATCAG AATAAATTAG 24 900 

GAAGGGGTTG GTGTGAAGGT TCAAGGATTT GTACTTTGTG ATGAGGTAAA ATGAGGTTCA 24 960 

ACAGTGATCG AGTACCCTTG GAAAGTTGAT TTGGGGCTTA CATCAGGTGT AAAGAGTTTT 25020 

CTCATGTTCA AATTCAAATT TACCTAAGAT TGATTGAGTA TCTACTATAC GCCATCCAGA 25080 

CTGCCAGGTA CTTTAGTAAT TTAACAAGCA AATATTAAGC ATCTCCTTTG AGCAAGACAC 2514 0 

CAAGCTATGC TTTCATATGC ATTATCTCAT GAATTCCTGC AGCCGCCCTG GCTAGCATGT 2 5200 

ACTTGCCTGG AGATTTGCCA CCGCTTAAAA AATGCCAAAC AATGGTTACC AATCTTGTCA 2 52 60 

CATTTCTAGA GCATCCATGA ATTCATGGCT CTTTATTTGA GGGCGTATTC TCAATCTGAG 25320 

ATATGAGCCT CCTGGTATGA TAAACTCAAA CTTTCCACCA GAGATTCATT GAAAACTCAT 25 380 

TCACATATTC ACTCATTCCT TCATTCCTTT AGCAGTTTTG AATGCCTAAT ATTCTAGAAA 2 5440 

ACTTAGAACA TTCTGTGAAC ATTCCCTTTT TACTTTCTTC ACTAAGGTTT GGAGAAAGCC 25500 

AGAGCCAGAC GTTGCAGACC AATTATGTTG ACTACTTGGA CGAGCTCGCC T TAG AG AT AG 2 55 60 

GTGCGAAGCC AGATTTCTGC TCTCTCTTGT TCAAAGATCC TAAACTGGCT GTGAGACTCT 2 5 620 

ATTTCGGACC CTGCAACTCC TATTAGTATC GCCTGGTTGG GCCTGGGCAA TGGGAAGGAG 25 680 

CCAGAAATGC CATCTTCACC CAGAAGCAAA GAATACTGAA GCCACTCAAG ACTCGGGCCC 257 4 0 

TGAAGGATTC ATCTAATTTC TCAGTTTCTT TTCTGTTGAA AATCCTGGGC CTTCTTGCTG 25 800 

TTGTTGTGGC CTTTTTTTGC CAACTTCAAT GGTCCTAGTC AGCATAATGC TTTGGGCTTT 258 60 

ATTATCTTGT CAGTCACTAC CTCCTAAAGA AAAAAAAAAA GGCTAGAAGA AAAAAC AT T A 2 5 920 

CATTCATGTT CTAATTATAG ATTTTAGAGT TAGGTAGTAC AGGTAAGGGG GAAATTGTAA 2 5 980 

AGAATTAGCA GAATTAGGCA TATGTACAAA ACCAAA 26016 



.DOC ID: <WO 98249 14A1J_> 



WO 98/24914 



PCT/FR97/02226 



66 

(2) iN FORMAT IONS" POUR LA SEQ ID NO: 2 f " 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1731 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

AACCAAGGGA GAAAACTATT CTGTCAAAGA GACGGTGCCA AAAGGCAAAA ACAAAGGAGC 60 

TGATGGCAAA GAAGGTAGCT GTGATTGGAG CTGGGGTCAG TGGCCTAATT TCTCTGAAGT 120 

GCTGTGTGGA TGAGGGACTT GAGCCCACTT GCTTTGAGAG AACTGAAGAT ATTGGAGGAG 180 

TGTGGAGGTT CAAAGAGAAT GTGGAAGATG GCCGAGCAAG TATCTATCAA TCTGTCGTTA 24 0 

CCAACACCAG CAAAGAAATG TCCTGTTTCA GTGACTTTCC AATGCCTGAA GATTTTCCAA 300 

ACTTCCTGCA TAATTCTAAA CTTCTGGAAT ATTTCAGGAT TTTTGCTAAA AAATTTGATC 360 

TGCTAAAATA TATTCAGTTC CAGACAACTG TCCTTAGTGT GAGAAAATGT CCAGATTTCT 4 20 

CATCCTCTGG CCAATGGAAG GTTGTCACTC AGAGCAACGG CAAGGAGCAG AGTGCTGTCT 4 80 

TTGACGCAGT TATGGTTTGC AGTGGCCACC ACATTCTACC TCATATCCCA CTGAAGTCAT 54 0 

TTCCAGGTAT GGAGAGGTTC AAAGGCCAAT ATTTCCATAG CCGCCAATAC AAGCATCCAG 600 

ATGGATCTGA GGGAAAACGC ATCCTGGTGA TTGGAATGGG AAACTCGGGC TCAGATATTG 660 

CTGTTGAGCT GAGTAAGAAT GCTGCTCAGG TTTTTATCAG CACCAGGCAT GGCACCTGGG 72 0 

TCATGAGCCG TATCTCTGAA GATGGCTATC CTTGGGACTC AGTGTTCCAC ACCCGGTTTC 780 

GTTCTATGCT CCGCAATGTA CTGCCACGAA CAGCTGTAAA ATGGATGATA GAACAACAGA 84 0 

TGAATCGGTG GTTCAACCAT GAAAATTATG GCCTTGAGCC TCAAAACAAA TACATTATGA 900 

AGGAACCTGT ACTAAATGAT GATGTCCCAA GTCGTCTACT CTGTGGAGCC ATCAAGGTGA 960 

AATCTACAGT GAAAGAGCTC ACAGAAACTT CTGCCATCTT TGAGGATGGA ACAGTGGAGG 1020 

AGAACATTGA TGTCATCATT TTTGCAACAG GATATAGTTT CTCTTTTCCC TTCCTTGAAG 108 0 

ATTCACTCGT TAAAGTAGAG AATAATATGG TCTCACTGTA TAAATACATA TTCCCCGCTC 114 0 

ACCTGGACAA GTCAACCCTC GCGTGCATTG GTCTCATCCA GCCCCTAGGT TCCATTTTCC 1200 
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CAACTGCTGA ACTTCAAGCT CGTTGGGTGA CAAGAGTTTT CAAAGGCTTG TGTAGCCTGC 12 60 

CCTCAGAGAG AACTATGATG ATGGACATTA TCAAAAGGAA TGAAAAAAGA ATTGACCTGT 1320 

TTGGAGAAAG CCAGAGCCAG ACGTTGCAGA CCAATTATGT TGACTACTTG GACGAGCTCG 138 0 

CCTTAGAGAT AGGTGCGAAG CCAGATTTCT GCTCTCTCTT GTTCAAAGAT CCTAAACTGG 1440 

CTGTGAGACT CTATTTCGGA CCCTGCAACT CCTATNAGTA TCGCCTGGTT GGGCCTGGGC 1500 

AATGGGAAGG AGCCAGAAAT GCCATCTTCA CCCAGAAGCA AAGAATACTG AAGCC AC T C A 15 60 

AGACTCGGGC CCTGAAGGAT TCATCTAATT TCTCAGTTTC TTTTCTGTTG AAAATCCTGG 162 0 

GCCTTCTTGC TGTTGTTGTG GCCTTTTTTT GCCAACTTCA ATGGTCCTAG TCAGCATAAT 168 0 

GCTTTGGGCT TTATTATCTT GTCAGTCACT ACCTCCTAAA GAAAAAAAAA A 17 31 

(2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 535 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

Met Ala Lys Lys Val Ala Val lie Gly Ala Gly Val Ser Gly Leu lie 

15 10 15 

Ser Leu Lys Cys Cys Val Asp Glu Gly Leu Glu Pro Thr Cys Phe Glu 
20 ' 25 30 

Arg Thr Glu Asp lie Gly Gly Val Trp Arg Phe Lys Glu Asn Val Glu 
35 40 45 

Asp Gly Arg Ala Ser lie Tyr Sin Ser Val Val Thr Asn Thr Ser Lys 
50 5 5 60 

Glu Met Ser Cys Phe Ser Asp Phe Pro Met Pro Glu Asp Phe Pro Asn 
65 70 75 80 

Phe Leu His Asn Ser Lys Leu Leu Glu Tyr Phe Arg lie Phe Ala Lys 

85 90 95 

Lys Phe Asp Leu Leu Lys Tyr lie Gin Phe Gin Thr Thr Val Leu Ser 
100 105 110 
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Val Arg Lys Cys Pro Asp Phe Ser Ser Ser Gly Gin Trp Lys Val Val 
115 120 125 

Thr Gin Ser Asn Gly Lys Glu Gin Ser Ala Val Phe Asp Ala Val Met 
130 135 140 

Val Cys Ser Gly His His lie Leu Pro His lie Pro Leu Lys Ser Phe 
145 150 155 160 

Pro Gly Met Glu Arg Phe Lys Gly Gin Tyr Phe His Ser Arg Gin Tyr 
165 170 175 

Lys His Pro Asp Gly Ser Glu Gly Lys Arg lie Leu Val lie Gly Met 
180 185 190 

Gly Asn Ser Gly Ser Asp lie Ala Val Glu Leu Ser Lys Asn Ala Ala 
195 200 205 

Gin Val Phe lie Ser Thr Arg His Gly Thr Trp Val Met Ser Arg lie 
210 215 220 

Ser Glu Asp Gly Tyr Pro Trp Asp Ser Val Phe His Thr Arg Phe Arg 
225 ' 230 235 240 

Ser Met Leu Arg Asn Val Leu Pro Arg Thr Ala Val Lys Trp Met lie 
245 250 255 

Glu Gin Gin Met Asn Arg Trp Phe Asn His Glu Asn Tyr Gly Leu Glu 
260 " 265 " 270 

Pro Gin Asn Lys Tyr lie Met Lys Glu Pro Val Leu Asn Asp Asp Val 
275 280 285 

Pro Ser Arg Leu Leu Cys Gly Ala lie Lys Val Lys Ser Thr Val Lys 
290 295 * 300 

Glu Leu Thr Glu Thr Ser Ala lie Phe Glu Asp Gly Thr Val Glu Glu 
305 310 315 320 

Asn lie Asp Val lie lie Phe Ala Thr Gly Tyr Ser Phe Ser Phe Pro 
325 330 335 

Phe Leu Glu Asp Ser Leu Val Lys Val Glu Asn Asn Met Val Ser Leu 
340 ~ 345 350 

Tyr Lys Tyr lie Phe Pro Ala His Leu Asp Lys Ser Thr Leu Ala Cys 
355 360 365 

He Gly Leu He Gin Pro Leu Gly Ser He Phe Pro Thr Ala Glu Leu 
370 375 380 

Gin Ala Arg Trp Val Thr Arg Val Phe Lys Gly Leu Cys Ser Leu Pro 
385 390 395 400 
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Ser Glu Arg Thr Met Met Met Asp lie lie Lys Arg Asn Glu Lys Arg 
405 410 415 

lie Asp Leu Phe Gly Glu Ser Gin Ser Gin Thr Leu Gin Thr Asn Tyr 
420 425 430 

Val Asp Tyr Leu Asp Glu Leu Ala Leu Glu lie Gly Ala Lys Pro Asp 
435 440 445 

Phe Cys Ser Leu Leu Phe Lys Asp Pro Lys Leu Ala Val Arg Leu Tyr 
450 455 460 

Phe Gly Pro Cys Asn Ser Tyr Xaa Tyr Arg Leu Val Gly Pro Gly Gin 
465 470 475 " 480 

Trp Glu Gly Phe Arg Asn Ala lie Phe Thr Gin Lys Gin Arg lie Leu 
485 490 495 

Lys Pro Leu Lys Thr Arg Ala Leu Lys Asp Ser Ser Asn Phe Ser Val 
500 505 510 

Ser Phe Leu Leu Lys lie Leu Gly Leu Leu Ala Val Val Val Ala Phe 
515 520 525 

Phe Cys Gin Leu Gin Trp Ser 
530 535 

(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 254 64 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : double . 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

TCCAGTCCTG CAGCAACCTC CTAGTTCCTG CTCTTTCAGC TCTTTGACCT TTTGCAAGCA 60 

CCTAATTCCC TGTAGTATAT ACCTTTCTTC ATGATATATA GTGTTTTTTA TCTCCTGCAC 120 

TAAATCATGA GCATATGCAT ATAAATCATA ATATGAAATC TTAAAAACAG AAGTACTTTT 180 

GCTGAGGCAT TAAGCATATA ATCAGTCAGC AGGTCCCCAA ACATCTAATT CCTGAATATC 24 0 

TCATATATCC TGTCTCCATT ATCCATTCCT CTAATGCTAC TCTAATTTAA GTCCTCAGTC 300 

TCTCTGGCCT AGATTGTTGA AATAACATCC TGGGTTTTTG GTCTCCTTGA TTCTAGTCAC 360 

CATCCTCTCT AGCCTCCAGG TGAATCTGAT CTTGTCTGAT GTTGTCACTT CCTTGTTCAA 4 20 
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AATTCTCGAA TGGACAACCG TAATCCAGAA GGTAGTATCC AAACCTGTGA TTGTGGCACT 4 80 

TCAGTATCCT TCATAACCTA TGTCCTGCAT GTTTAACCCA TATTTTGCTA TTCCCATCAC 54 0 

TTATGGTCCA GCAAAACTGA ACTAATTGTA GTTCCCCCAT CACGTGTTCT TACTTTTCTA 600 

TGCATTTTCA CATATTTTTC TCTCTGCCTT TTTTCTATTT CTTGTCCCTT ATCTGTCTGG 660 

AAAACATCTA TTCTTCCTTC AAGACTCAGC TGTCTTCTCA CACTCCTTGA AGCCTCTCTT 720 

TCCTCCTCCA AGTGGACCTA GATTTTTCTT CCTACATGCT AG C ACT AC AC TGAACCATAC 7 80 

TTCCACTGTG ACATTTATCA TCTCCCTCAA CACTAGACTT CATGGTTCCA GATGGAAAGC 84 0 

ACTGTGTCTT CTCACCTTTG AATCCCCCAA AAG AC TAT T A TAATGCATGA CATATAGTAG 900 

GCTGTCAGTA CAGTGAAAGG AATGGCCAGA GGAAGGAAAG GAGGGAAACA GAAGCAGAAA 960 

GGACAGGTAT AGAAGCCGGA GGGAGCCAGA GACAAGGTTC AGAGACCACA ATTCTGTCTT 102 0 

TTGAGTTCAC TAGTTTTACA AGCTCATCTA TAAGCGTTAG TTCAGCAACT CAGATCAGGC 1080 

CCTAAGTTTC CAGAAATTTG AGCTACTTTT CACTGTTGGC ACAACAAAAC GTTTCATTAT 114 0 

AGTCCAGGTG CATAGCCTTT GTTTATATAT TCTATATTTC CAAAGCAAAC ATAAATGAAA 1200 

GAATCATTGT TCCCCTAATC TCCCAGGAGT TTCACCTTAC AGCTCCAGTG GCCATGGCAG 12 60 

TCACTGTTTT ATATTTTTTG TAACAAGAAC CAAAGACTTC ATTCTTCCTT TTTCCTACCC 1320 

CTTTCTTTTT ACTTCACCCA TGCCTCCCCT GTTCTTCTCT TATCCCTACC ACACTCGTCC 1380 

TTCTCTTTCA GATTTTACTA TGGCTCTATA CCATTAAAAA TACAAGAAAA AAAAGGAATT 1440 

TTACTTTAAG AATAACTCCT CCCCCTTCCC CAGTTTTCAC ATCAAAAGAC ATTGTTAAAT 1500 

GCCATTCTCT TCCACATTTC GAGAACTGCT GATTCTCTGG GGAGAGAAAG GTGATTGCTT 15 60 

AAG AG G T G AA GTCCCTTAGA GCATTCAAAA TGAGGAGTGA TTCTGTACAG AGGATATCAT 1620 

GCAGCAGGCT GGATGTCTAG TTCCAATTCC TTTATTTGTT ACCTCTGAGA CCTTGAAGAA 1680 

GTAGTTTCTA GTCTCAGCAT ACCAAAGCGT CATCTGCAAT TGAGAGCATT GGATTGATGA 17 4 0 

TCTTCAAGGT CCTTCCTGCT CTAGCATTCA CTGAATCTGC TATTTTTGAC ATATTGAATA 1800 

ATCAGAAGCA GCCAGTTTTA GAATCTTATT AT AG C AAAAG TGGTAAAAAT AATGAGCATA 18 60 

TACTATCAAT GTGCATCTAT GTCTTCTTAT GTTTGAGTGA GGATCCTGAT ACATAAACCT 1920 

TGGCTGATAA TTTCTACTGA AAAAAATCGT AAGT AT T AAA GACACTCTTC TGAAGATGTT 1980 

CTCTCCAGAC TCTGCTACAG GCAATCATGA GCAAGAGGGT TGGCATCATC GGAGCTGGAG 204 0 
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TCAGTGGCTT GGCTGCCATA TGGTGCTGTC TGGAGGAGGG GCTGGAGCCC ACTTGCTTTG 2100 

AAAGGAGCGA TGATGTTGGA GGCCTGTGGA AATTCTCAGT GAGTGGCACA TCATTAGAAC 2160 

ACCAGTGGAA GGAGATGGAT TCCAATGCAA ATCAAATCTG ATCAGTTCTA ATTCAGATTT 2220 

AGAAGGCAGA TCACAAAAGC TCCAAATCTG GAAAGTAAAA TCTTACCTCT CCAATCATAC 2280 

TAATGCCCAA AAAAACTATT TCATACCAGC AAAATTTGTC CTGAAAAGGA CATTTTCAGC 2 34 0 

TCATTAAACA TCATCACCTG CATGGTGAAA TCCAGATCTC CAAGCTGTAA AGGGCACTAA 2 4 00 

TGTTGGTAAT TAGTCAAAAA TATACCATGG GCTTCCCAGG TAAGTGAAAC AATTCTATTC 2 4 60 

TTTATTGCTC TTAAATGCCA GGAACACGAC TAGAAAAGAG ACAAACAAAC CTGGACTGAG 252 0 

ATCCTGAGGT CAGAAGTCCT GAGTTCTAAT TTCAACTTGT AGGTTTTCTA GGCAGATAAG 2580 

ATTTCAGTCC AGTTGCTTTT GTTTCCCTGG ACCTCAAATG CTCATTTGTC AAATGCAGAG 2 64 0 

GATATGATTC TATAATTAAC TTATGTCTAT TGGGCAGATA GAAATTATTA TAGATGATGA 27 00 

TTGTGTGTGC GGCTGTTGAA TAGCCTATCA GCTCCAAATC C AG AG G G AAA AATTATGGTC 27 60 

TTTGCCATTT GGGCTCATTG TAGAAATAAT ATAATTAGGA AATAGTCCTT GTAAACACAT 2820 

TTTTTTTTAA ATTTCAAAGC CAAGTTTGGA GAAACTTCTA GTTCTTCTGT CCTGGATTTC 2880 

CCAGCCATTG TAATCAGTTG TCGATGATAC ATATTTGGCT TGAAAACATA TTCACATCAT 2 94 0 

TCATATTGTA ACTACTTCCT GTCCTGGTCT CAGTTACTGC TCTGCCTGCG CCAATAGCCT 3000 

CCTCCAATAG AGTATATCAG TGCTAACTTA GAACACATTT TTATTCTTCT CCAAGCTTTT 3060 

TTTAAAAAAA ATTGTGGTTT TGTAACCCTG AAAGCACTCC AT GAG AT AT A AGGTCATTAA 312 0 

TTTTTATTTC CCAGTAGGGG GTAATCAAGA GTTAATATTT TTCAAGAATT TAATTTTCCC 3180 

TATTTACATT TGCTCAGGGA AATGTGGACA GCTTAGAGTA AATCATAAAA TGGCTTTCTA 324 0 

CCATCTCCCT AGTAACAATT AAATGATGCT TGAGCATCTA TTCTGGTAGT TTGTGCTAAG 3300 

TACTGGGATG ACAAATATGG AATATAATCA CTCCTTGTAA ATGGTTCCAT TTCATTTGAT 33 60 

TAAGCAAGCC ATAATATAAT TCCGTAATCC TTTGATAGCA AATGGGCAAA AACTCATTTG 34 20 

ATAGCCGAAC CTCTTCTGAA ATCGTAAGGT TAAATACCGT GAATTGGATC AACATGAAGC 34 8 0 

TAAGTCTCAC CTTCTGTTGC ACGGCAGAAA TTTTATTGCA TTTGACAGAT TGCTGCCCCA 354 0 

GATCTCACTA GGAGTATTAT GGAGCAAAAT CCAAAAATGT ACACATTCCA AAATATATCT 3600 

GGCCCTAAGA CTTTTAAAAT AAGAGATTAT ATAACTACAA CAACAAGATA GACCTTGTCA 3 6 60 
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CCATCAATTC AATGGACGAG TGCCTCGAGC GTTTAGAAGA GGGTGGACTA CGGAAATCTT 3720 

AGTAGGTCAA AGAAAACCTC CCACAGGGAT GACACTTAGC CTTGAAGGAT AACCCCAGAC 37 80 

AAGCAAAATA GAGGACCACC TGTGACACAA CTCCTAGAGA GTGCATTTCC CAATAAAGTC 38 4 0 

TGCGAATGGC ACTCCATAGG CCTATGCAGT CATTGGCAGT GTGCCAGCAC CAGGTTAAGA 3900 

GAGACCAACA ATCCATGAAA GGCACAGAAA AGGCAATGAA CATGGTGTGT GCAGAGAGGG 3 960 

ATCCATGAGT TATCCAATAT AGCCAGATCA GAAAGTTTAC TTAAGGAAGC AATAATATGA 4 020 

TACAAAGATC AGTAAGATTC AAAGTTGGAT TCTGAGTTAT CCACAAGAGG AAATTCTTCT 4 080 

TTTCCATAAG GTCATGTCTA TAAGCAAAAT TCTACTCAAA GTCCTGGTGA GGATATGGAC 4140 

CCATACAAAT ACTCAAAACT TTAGCCTCCT CCACATACCC CAGCCCTTCC TTCTTTTCTT 4 200 

AGAAAAGTTG CTTGGCACAA T AT AT AAT C A GAGAGGGATT TTTTTTATGT GTTACATAAG 4 2 60 

ACTTTATCTT GTAAGCCTTT TTTAGAAGGT GTTCTAGCAG AC AG AAACG T GGTAATTCTG 4 320 

AACTTTTCAC TATTTGCTTT TTCTGAGAAA TGAAAACCAA ATGGGATTTA AATACTAGCA 4 380 

GGCTGAATGT GTGTTTTAAG TTTCATCCAC TCCTAAATAG GGCCTCGTGT CCTCAAAAGA 44 4 0 

TTTCATTACT GCTGTAATAA GAAGTTGCTC AACAGCCAGG TGCGGTGGCT CATGCCTATA 4 500 

ATCCCAGCAC TTTGGGAGGC CAAAGCGGGT GGATCACGAG AGGTCAGGAG TTCAAGATCA 4 560 

GCCTGGCCAA CACAGAAAAA CCCCATCTCT ACTAAAAACA CAAAAATTAG CCAGGTGTGG 4 620 

TGGTGGGTGC CTGTAATCCC AGCTACTCAG GAGGCTGAGG CAGGAGAATC TCTTGAACCC 4 680 

AGGAGGCAGA GGTTGCAGTG ACCTCAGATC ATGCCACTGC ACTCCAGCCT GGGCAATAGA 4 74 0 

G AAAG ACT CC ATTAAAAAAA AAAAAAATGC TTACCAATAG GTTAGTAGCA TTTTGATTGC 4 800 

AAAAGCTGAA GCCAGGACTA TTTGAACTTT TTCCCACTCA TTTATTCCTT TGTTCATTCA 4 8 60 

AT G AAT AC AT ACTGTGTACT TTATGTGTAG GGTACTATAT TAAGCATAAG CTGCAGATAA 4 920 

GAGGCCAGCC AGCACTTTAA AAGCCGTGAG AAAACAAGTA TCAGAATAAC TATAAGTGAC 4 980 

TATATAATTA GGGCAATAAG GATAATGGGA CCTTAGTAAA ACT AAAG ATG ATTTGGCAGT 5040 

AGCTGAGAGG GAAGGTAAAG AAAGCCATGA CAAAGTTGAA GGCAACTTTT GAGCATATTT 5100 

CAAGGGCATA TTTAGACAAG GAGATATGGG ACTCATAAGC AGAGCTGGAA TAGGAAAGAA 5160 

GATCAAGGTA AACTGCTTAG ATGCATGTAC AACATTCTGA AATTAACCTC TGACTTTGCC 5220 

CTCAAGTTAC TTATGTTCTC GTGGGAAAGA T GAG AG ATG A ACACGGTTAT CATCCAAGAC 5280 
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AGATGGTGCC CACAGCTGCT TAGATCTCTG GTTCCAGGGT AAAGCTCCCT CAGCTAGAGG 5 34 0 

CAGAGTCAAA GTTGAATTTC CTCCTTACTG GCTCAAACCA CACCTCATAT TGAAATAATA 5 4 00 

AAAATGCATG CTCCCTGGAG CAACTGACTT GTTATCTAAT ACATTTGCTT TTTTGTGTTC 54 60 

ACTTGGAGAA CAGTCTTTTC GGAAAAATTC CAAGGAGCTG TAGTGTACAT ACTCTTCTCT 5520 

CCTGGTGTTA TAATTGGCTG AGGTCAAGGG GCAAAAAAGC AGAGATTCAT TCAAGATGGA 5 580 

AATATTCCAA GGCCTTAGCA TCTGTTTCCC AGAACAGAGT CTTACATTCT TTAACCAGGC 5 64 0 

TCCATCCCAC AGTTCAGCCC TGCCTCCTTT CAACAGGCAG CTGAAAAAAC CTCCTTCCCA 5700 

CCTCTCCTTC TCACAACCAT CAGTAGAAGG CGCTAGCTGT GGGTGAAAGG GAAGCACTCA 57 60 

GCCTGCCAAA CTGCTGGACA TGAGCCTTCA CCCTTTTTCT GACCTCCACA AAAATTTTAA 5 820 

AAAGTTTAAA TTCCTGTGCT TCCACGCTTA TGAGAAATAC AGCAACCATG AATAGAGGAA 588 0 

GATTATGTTT TCAACTTGAG AAAAAATACT GAGGCTTTGG GCAGCCCCCC ACTTCCCCAC 5 94 0 

GGGGACACAA TCCTCTCAAC CCTTTCCAGC ACTTTTTGTT TCCCTCTTCC AGAGGTCATC 6000 

TGGTGTGAGA GGGAGATACA CATCTTGAAT CCAGCAGCAA CGTGACATTC CATCTCTTTC 6060 

CCCCCATTGC ACAAGAGTCC CTTCCGGACC TCGGGAAGCA GAAGCTGCCA GCTCTGAAAT 6120 

GTATTTTCAA GGCAGCACAT TGTGTGCACT TTTACCCTAC CCTCACAACT GAGAGGAAAT 6180 

GTTTATTTTC AATTTAGCTT TTGACTGCTT CTAAAAAATA AGCCACTTTT CAATTACACA 624 0 

GAGGCTTTAA AATGAAGTGC CAAGATTTAA CACATGTTCT AAGGGCTCTG GTTTCCTGTG 6300 

TTTCTTTGGT GAGGAGTGAA GTCCAGCAAC TGGTGAGCCA AAGAATAGGA TTCATTTACA 63 60 

ACAGAGCAGT GGTTCTCAAA GTGTGGTTCC TAAACCAGCC ACATCAGCAT CACCAGGAAC 64 20 

TTGATAGAAA TGCAAACCAC CCCAGACTCC ACCCCAGACA GATTGAATCC GAAATTCTAA 64 80 

GAATAGGGCC CAAGAATCTA CGGTCTAGGG AGCTTCCAGG CGATTCTCAT TACGCCAAAG 654 0 

CTGGGAAACC ACTGCAATAT TGGGTTGTTG CCAGTGAAGA GTTTGCTAAA CTCCAAAAGC 6600 

AAATAAATAG GCTAGAAGTC AGAGCCTCTT CTAGACAGTT TTGTTTTTTG TTTTTTTTTT 6 6 60 

AACCTGAGTA TAAGATCAGA ACCAGTGGTG GCACAGGAGA AAGCAAAAAC CACTAAGTGG 67 20 

CTATAAAGAC AGAGCTAACA CTGAGGGTAA TTACAGTAAG AGGATTCACA TGGAAAGAGC 67 80 

TCCAGTTCTG TGCCAGGTTA CGCGAAGGGC TTTCCATTCC TTATCTTACT GAGAGCTTTT 68 4 0 

AATTTTTGTT TACGCTTTTA AACATGAAAA GGGTTTTAGT CAACCAAGAA TTGAACCACT 6900 
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GTGTTCACTG AAGGGAACAC AATTCTTGGC TTTCTCTTTA AGCTTTCTTA TTCTCCCTAG 6960 

G AC C AC AC AG AAGAAGGCAG AGCCAGCATT TACCAGTCTG TATTCACAAA CTCTTCCAAA 7020 

GAAATGATGT GCTTTCCAGA CTTCCCTTAT CCGGATGATT ACCCAAACTA TATACACCAC 7080 

AGCAAGCTCC AGGAATATAT AAAGACATAT GCTCAAAAGA AGGATCTTTT AAGATACATA 714 0 

TAGTTTGAGG TAGGGGTCTC ATAACTTGTA CTGTTGAAAT TAAGATATGT GTGGGTTAGA 7200 

G AAAAAG G AG GCAGCAAACT ATTATAAAAA TTAGAGCCAA ATGTTTGGGC ACCTCAGTAA 7260 

TCAAATGTTG GGTCTGATTA TAAAGCATTC ATGCATTGAT TTTTTCTCTC CTAGACTTAC 732 0 

TAGTTCACTA GTCTCTGAGA GCTTTCAGAC TACCTTAGAA AATGGAGGCA GCTAGCCCAT 7 380 

CATTGTCCAC TTTCCACCCT CATGCTCTGA TGTTTTGGAA ATAATCCAAA ATGCTTTAGT 74 4 0 

ATATATTAGG AATTTTGTCA GTTCAATGCC AATGAGTTGT GGTTCAAAAA ACCAGAGCAT 7 500 

TTGGTAGGGT TTCTCCCATT ACATTATGAA AAGGTTAACA ACTTAAATGG GAAATATAGT 7560 

CATTGCCCCC ATCTTTACCC ACTCAGTTCA TTAGTTTTTT T AT T AAAAAG GTGAGATTTC 7 620 

AGCATTGTTT CTGCGAGAAT AATGTTTTAC ATTTATTTGG GACTCTTTAT TGAGCATTTC 7 680 

TGTCTGTATG TTTGGAACTC TTAACCTCAA TTAACTGCTG CTAAATGCAG AACACTTGCA 774 0 

TATAGTGGGA AAAAC AAT C A GCAAAATTAT GAACCATGGT GATATTTACA TCATTATTTT 7 800 

ACCTGGAGTA GCCCCAAATG TAT AG T T AAA ATAAAATTTT CCAATAGTCA TTTTATTCCA 78 60 

TTCATTCATT ACATTCATTT GCTTCCATTA TGGTGTTAAT ATCAACAAAC ATTAATGAAG 7 920 

TTCCTATTGT GTGCTTGCAT TGTGCTATGT GTTATATGTA AAAGAAAAAG AGGTCTAAGA 7 98 0 

CTTAGCTCTC AAGAAGTTAT TTCAAAATAA ATATGTAAAG AGTAAGTAAA AAGATTCCAG 8 04 0 

TAACAATTTC AATCAAAGAG AAAATTTTTT AAAGCTCTTT ATGATTTGTT TATAAATAAA 8100 

ACAATGCTAT GGAGATCATG AAGCAAGAGG CAACACTTTG GGGGAAGGTA TTTTCTAGAG 8160 

GAGGTAAAAT TTAGTTGTAT TTAGTAGGTG TTTTAGATAA ATGAGTGGCA TGAGTAAAAT 8220 

TAGAGAGGTG GGAAAATGCC CTGCTCATTT GGAGAACAGT GGGCAAACCA AGTTGGTTAG 8 28 0 

GAGGGAGATA TATATGCTAG GATGAGATAT GGCCACATAT ATCAGTAAAC TAGTGTGTAC 834 0 

TGTGACTTTG AAAAAT AG AG GATTATTTTG CAACCATGTA AAAGAAGTCC AAAGAAGGGA 8 4 00 

CATCCAGAGC TTATGTGATG GCACCAAAGT TATCAAAGAT TCAGCTTCAC CCATCTTAGC 8 4 60 

ACGTGGCCTA CATCATGACG TTTGCCTTGT GGTGCAAAAC AGTTGCTGAA GCTTGAGCCG 852 0 
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TCACATCTGC CTTCTAGCAA AAAAAAAAAA AAAGTAAAGA ATGAAGGGCA AAGGGATGTT 8 580 

CTCTCAGCTG AATCAGCTCC CCTTTTACAA ATTCTCCTGA AAAAACTGTC CAACATTGCT 8 64 0 

TATATCTCAC AGGCCACCCT AGTTGCACAG GAACCTGGAA AATGCATCCC TTTTCTGTGT 8700 

ATGTTGTCGC TCCAAACAAA ATCAGGGTTC TGTTAGTAAG AATGAAGGGA GAATGGACAT 8 7 60 

TAGGGAAGCA ATTTGCAGAA TATGTTCCAG AAAAGTCTGT GGGAATAACA GAAAATAAAA 8 820 

CTAAAAGAGT AAATTGGAAC AAAATTGTAT GGACTTAATA GTAATCGCAT TCAAAATGTA 8 880 

GAATAAGTTT TAGAGGCTGT GAAGTAACAG AAATTGAGCA GTGAATTGAG CAGAGAAATT 8 94 0 

GAGAAATGAA TATAGTCCTT CAGGAAGATT AATCTGACAA GC AG G AC AAA GGATGGCTTG 9000 

TAGGAAATGG GAGGCTGAAG ACAGGCTAGG TATAGGTTCT TGCCGTAGTC CATGCAAGGG 9060 

AGTGATAAGG ACTTGAATGA AGGCAGTGTT AGCAATCATG GAAAGAAAGC GTGAGATTGG 9120 

GAGATAAATA CTGTTTAAAC ATGAGGCAAG GATG G AG AAA TAACAAGGAA AACAAGTCAT 9180 

GGATTTGAAG CATAAGTGGC TGGGAGTTTC ATGTCATCAT TCAAAGAAAT AAGAAAGTCA 924 0 

GAAGCCAGTT TCAAAGGAAA TTTAAGTAGG TCAATCAAAA CCTGCTACAT ATGAGGAAGT 9300 

ATTAGGTGGC CCTCCAGATG GAAAGGTCAA GCTAAACTGG ATAGAAGAGA GACCAAGGAT 9 360 

AGATGTATTT GTATATTCAT ACCACAAAAC TTGCTAATTT TTTTTTTTTT TTTTTGAGAC 94 20 

GGAGTCTCGC TCTGTCGCCC AGGCTGGAGT GCAGTGGCGC AATCTCGGCT CACTGCAACC 94 80 

TCCGCCTCCC GGGTTCACAC CATTCTCCTG CCTCAGCCTC CTGAGTAGCT GGGACTACAG 954 0 

GCGCCCGCCA CCACGCCCGG CTAATTTTTT GTATTTTTAG TAGAGACGGG TTTCACCATG 9600 

CTAGCCAGGA TGGTCTTGAT CTCCTGACCT CGTCATCCAC CCGCCTCGGC CTCCCAAAGT 9660 

GCTGGGATTA CAGGCATAAG CCACCGCGCC TGGCCGTAAA GTTGCTATAT TTCTAAGATA 9720 

AGAGTATTTA TGCAGAGCAA AAGAGATGCC AACG AT C AAA CCTTGAGATA TTCCCATACT 97 80 

TATTGAGTAG ATGGAAGATG AGGTCAGAAA AGGAGGAAGC CATGTCAGTA GAGGGTAGCC 98 4 0 

ATAAGAAAAT AACACAGATT TGTTATATGA CAT CAT TC AC AAAAATATTC AGTGTGATTT 9900 

ACCCCTAAAT CAACTAACTT GATGTCAAAA AGTAAATGTA CTCCAGTGAG TAATTTTTCT 9960 

TGTGAGATTC AAAGACTCAC TGAAGATTCA CTGTGACTCC AATTTTACTA TCTTTCTATA 10020 

CATTTCTGAA TGACCAAGAG AGCTCGTAAC AATTATTTCC TCCACAGAAA CAAGGCAAGA 10080 

AGGAAAAAAA CTTTCACATG TAGAATTATA AATGGAAAAA TAAATTTTCT AGTTTTCTTA 1014 0 
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AAGACCCTGG TTTCCGGTAT AAAGAAATGT CCCAGCTTCT TAGTCACGGG CCAATGGGTT 102 00 

GTTGTTACTG AAAAGGATGG GAAACAGGAA TCTACTATTT TTGATGCTGT AATGATTTGT 102 60 

TCAGGACATC ACGTATACCC CAATCTGCCA ACGGATTCCT TTCCTGGTAA GTTTGGAAAA 10320 

TATATAATAA TCTAGGGACT T AT AT GC AAA CATCAAGAGT TAGAAACATA TCTTTCTATA 10380 

GGTATTACAT AATGATTATT CTTAGATTTC AAAAGAAAAA AATTAAGTTT AATGATAGGA 10440 

TATAGTAATA AATAGCCTCA TAAGTCCTTA TGTTAAAATA ATCAAGGACT GCAAGCCAGA 10500 

GATCAGACAA ACACAAGTTC CTGTGTTACA GACAGTAACT CAAATATAAG TTCTAACAGC 105 60 

ACACGGGGTC TCCGAGCACA GTTACATTAA AAAAAAGTAG AGTCCAACTG CCAAATGGTT 10 620 

TAAAGAAAGA CACGTTTACT TATGTTATTT ATAGGAGACT CCTAGGTTTC TAATTTCATC 10680 

TTCATCCACA ATTTGCAAAT AAACTTTAGA AATCTCAGTG ATTTGTGTGT GGGTACACAC 107 4 0 

ATGGGTGTGT GTATAGCAGC ATACTTCATT ACCATCCGAA AGTGGCAAAC CTCAAATAAA 10800 

TACAATATAC ATGGAGGCTT CCTTCCATTT TTCCTTCCTT CCTTGCCACA GGAACACAAT 108 60 

CTACTCAAAG AT AT TAG AG T TTCCATGTCT AGGTATGATG TCCATAGGCC GAGGAAAATT 10 920 

AAAGAGTGAA GGTTCAGGAG GAATATAAGA TTAAAACTCT TAATGTTAAC GGGCAGCATA 10980 

TTTAATGTTT ATGAGCATGG GATCAGAACA CCTGGCCTCA ACTTACTATT CCACTAGTTC 1104 0 

CTTACCACTT AACTTCTTTG TCTCAATTTC CTCTTCTTTT AAAATAGGGA CAATAGCCCA 11100 

CCATGCAGGG ATGTTATCAA GATTAAATAG TTAAAACGTG TAAAGCATTT ATCAGAGGAT 11160 

CTAGCCCACA GAGTTAACTT AATAAATATT AACCATTATT ATTATCGAAA CATACATTCT 11220 

CATGCCTTAA GATTTTTTAA GGAACTAAAA GTAAGTTTTA GGGGGCTTAA TGTCAAAAAA 1128 0 

TGCTAAATGG ATAAATGCAC TTCAACTAGG GAATTTTTTA ATTACAACTG ATAATAGGTT 11340 

T AAAAAG AC A CAAAGAAAAC ATCTTCATAA TTTCTGAAAA TCAGTTCAAA CAACTTGCCA 114 00 

TGTTCCACTT AGGCCTGGAC CAGTTTCGAG GCAACTACCT CCATAGCCGG GATTATAAGA 114 60 

ATCCAGAAGC CTTCAAGGGG AAGAGGGTCC TCGTGATTGG TCTGGGGAAT TCGGGATCTG 11520 

ACATTGCTGT TGAGCTCAGC CGTCTGGCTA CACAGGTACA TGACGTAAAG GTTTTGGGAA 11580 

ATAAACCTAA GGTAGGGCTG TGCTACTAAA TCAGTAGCCA AGGCACAGAG GATGGTACTT 1164 0 

CTATGTCACA GCACAAGAGA TCCACCTCTT CTATGTGGCC CTTCAAATCA AGGAGGACTT 11700 

GAGACATCCT CCATGTGAAG CCAGGTAATG TGGCCCGTGC TAGTAAGGAA GTACATTCCA 11760 
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CTGAATCCAG AAGTAAGTGC ATGAGTGCGT GTATGTACAG ATGAGTGTGT ATGTGTGTAT 118 20 

TTCTTGTTTT CATTTTATAT TCTGATCACC TCCAAATAGA CTAGTTCCTG GTCAGGCTTA 1188 0 

ATCTTTATTT ATTTAACAGT ATTTATTATA ACGTATCATG CAAAAAGCAC TGTGTTTACC 11940 

ACTCTGAAGT TCTGAAAGAT AT G CAT G ACT TGGTATTTAC TAACATTAAT TCAATCAACA 12000 

GCAGATGCTC AACAAATATT GGGCACTTAC TATGCTTACT ATGTGTCAGA ACTATGATAA 120 60 

ACTAAAAATA AATGCATAAA TAAGTTAGAC TAGTTCCTGA CTTCAAGAAA GAGTCAATGG 12120 

ATGGAGATGG AGTTGACAGG TACACACAGA CTATCACCAG AGGAGATGGT GAGTCTTCCA 1218 0 

GTAGAATTAG GTGTGGCAAT AGCAACACAG GGAAAAGAGA ATCTAACTTA GCCTGGATGA 1224 0 

GGTCAAGGAA GACTTCCCAG AGGACTCCAA GCTAAATCAT GTATCATCGA TAGACCCTAA 12300 

AGAAACAACA TATTTTTAAG AAAACAGGTT CTCAATAAAT AAATTCTTAA ATGGATGTAA 12 360 

ATAAAACCTT AATTTTTTAA ACTAAAAATT CCCTTCAGTT ATCACAAAGT TAAAGTCTAT 12 4 20 

TTTGCAAAGA CGGTAAAATA GATAAGCAGC CAGACTCATC TCAGGGCTGA GGCGGTTGCC 124 80 

ATGGTTTGGG TTGCTCAGGA GAAGTCCTTG GGGTATGTGT ATAGGGAGAA CTGGAAAAGG 1254 0 

CAACCAGAGA CAGAGAACAG AATTAAATCC TTGACATCTC GTCAGCCTAA TTTCAGCTAG 12600 

AGATTTAGCT ACACTTTTCC CACACCTAGT CCACTATCAC CAGCCACAAC CACTGGGGCT 12660 

CACTGGATCA TCTGGTCCCT ACCAGACTTG CCATCTTAGT CT AT GAG TAT GTGAAGATTA 127 20 

AACCATCACA GTTGAACACA GAGCCCTGTT GTTCCTAGAG TGATGATTCT AATCCTTTCA 127 80 

ACAACTACAC ACCAGCCCTC AGGGGCAGTG AAAGAATCCT GTCTCTACTA GTTTAAATTT 128 4 0 

TAGACTTTAA AAAAAATTTT TTTTATTTTA AGTTCTGGGA TACATGTACA GAACATGCAT 1290.0 

AGGTCTGCAC ATGCCATGGT GGTTTGCTGC ACCTATCAAC CCTTCATCTA GATTTTAAGC 12 960 

CCCACATGCA TTAGGTATTT GTCTTAATGC TCTCCCTCCC CTAGCCCTCC ATCCCCCCGA 13020 

CAGGCCTTGG TGTGTGTTGT TCCCCTTCCT GJGTCCATGT GTTCTCATGA TTCAACTCCT 13080 

GCTTATGAGT GAGAACATGC AGTGTTCGGT TTTCTGTTCC TGTGTTAGTT TGCTGAGGAT 1314 0 

GATGGTTTCC AGCTTCATCC ATGTCCCTGC AAAGGACATG AACTCATTCT TTTTTATGGC 13200 

TGCTAGACAA CTTATTTAGA CTCGCCTTTT AAAAGTGTTC CTACTTGGAT ATTGAGGAAA 132 60 

ATGCACGGAA GTGCCCAAAG AAGTGTGTTG TGTTTGCTTA TTTCTTACAG AGTAATGCTG 13320 

AAATCTGTGT TGCTTTTCCC CACCAGGTCA TTATCAGTAC CAGAAGTGCT TCCTGGGTCA 1338 0 
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TGAGTCGGGT CTGGGATGAT GGCTATCCTT GGGATATGAT GTATGTTACC CGCTTTGCAT 13440 

CCTTTCTCCG GAATGTCCTT CCTTCATTCA TCTCTGACTG GTTATATGTC C AG AAG AT G A 13500 

ACACGTGGTT TAAGCATGAG AACTATGGCC TGATGCCTTT AAATGGGTAC TTAAAAATGG 135 60 

AAATTTTTTT T AT TCAAAAA AGGGGGGCAC TCATTTAATG AATTTATTCT CTCTAGAACT 13 620 

TACTTTTGTT GTCTCATTGA GCCTAGAAAC ATTAAACTCA AGGTTTCACA GGTGACGGAA 13 680 

TATGCCCAGA GACCACGTAT GGCTTGGAAA ACTTATTGAA ATTAGTCCAG TACAGAAAGG 13740 

GTATGGAAAA ATCTGAAATG GAGATGACGC AGGCAGATAA ATCACCCTGA CAT G CAT GAT 13800 

GCATTTGTGG TGGCTACAAG CTATAGCATA GAACTTTGAG GACTGAACAA ACTCAAATTG 138 60 

GTTTTTGGAA GAATATCTTG TCCGTGCTTA TGGGTGTATG AAGACATCAA TAATAATACT 13920 

TGCTTCTCAA GATGGTTGTG GTATTCAATA ATATAAAAAT AT AAAAAT T G CTTTCTAAAT 13 980 

GATAAAGCTT TAAAAAAATT GGTTCTTCTT AGTCTCAATT TTTCTAATGT GCTTCAAAGG 14 040 

AGCAAATAAC AAAATAGTGT TAATCAACAT GTCTCAGCAA GTAGGAAGTC TCAAAACAAA 14100 

AGTGCACACT TCCTCCACCC CTGAAATGTT. GACATTTTTG CAGAACCATC AGGAGGCATG 14160 

GAACACATAA AGTAATGGAG AGTCACAACT AACGTGGCCT GT AAG AT TAG TCAGATTCAT 14 220 

TTATTTACTT CTTTATAGAG ACAGGGCCCA ACATTTACTA ATTAGGAAGT CATTCCAGGT 14 280 

AGAAGAATCA GCATATCAAT AGAAAAAAAG AATATTTAAG TTGGTAAGAA AAGAAAGAAT 14 340 

TGAGAAATTT TATCTCCTGG CCCATGCTAG CCAAAAAGTT TCATTGTGTT TAGAGAAAGA 14 4 00 

TGGTAAGAAA AAGGAGGAAC TGTAAATCAA AAGAGCAAAT GCCAGATTTA GGAGCTAAAC 14 4 60 

TGTCAGTCCA AAG C ACT TAT ACTACCAAGT CTTGCAGGCT GCTATAACCC TTTAAAATAT 14 520 

GTTGATTTTA TGCATTTAAA ATTATGTTTA ACACTGTGGC TTGCTTGACA GTAGAGGGTG 14 580 

GGAGGAGGAA GAGAATCAGA AAAAAATACT TATCAGGTAC TATGCTTATT ACCCAGGCGA 14 640 

CAAAATTATC TATACACCAA ACCCCTGTGA CACACAATTT ACTTATATAA CAAACCATGG 14700 

ACCCCCAAAC CTAAAATAAA AGTTTTTAAA AATTATGTTT AATATAGTAA GTCCCATAGC 14 7 60 

TTGAGCTGGT TAAGATTTTT TATCTTGTAA GAGTAACTAT AAATTATATT TTGGCCTTGC 14 820 

CATTTAGACA ATTAAAACAT AGTTTTAGAA ATTCATTCAT TCTGAAAACT AAGCTTCCTT 14 880 

TTGGAAAGGG TTCCAATTAC CCTAAGTTTC TGGAGGGAGA AAGGGGGAGG AAAAACAGGT 14 940 

TTCATTGTGG TCTATGTTTT GCTACCTTGT AAGGTAAAAG AAGAGGTTGC AGGATTAGAT 15000 
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AAACAGAAAA TGATGTGGAA GTATAGAGAC AAATTTCAGG ATTTACAAGG TTTCTTTGTG 15060 

TCTGAGATAC TTGCAGGAAA TTCCGGAATC TCAAAGGAAA CTTAAATCAA AATGAAATAT 15120 

ATTGTCCTGA AAAATATTAT TCCTAGAATT TTGGCAACTA AAATGCAATA TCAAAGTTGT 15180 

TACACTTTTT TGTGGACACA GCTGATGAAA GAAAACCAAA CATGGCAATA AAACTTCCCA 1524 0 

CCACTGCAAG TCTGATTTCT CCATGTAAGA CAAGACGTTA AAGTTATGAT AATAGTGCAC 15300 

TTATAACAAC AGTGCTTGCA TGTGCCAGGA ACTGTTTTAA GTGCTTTAAG GATAATTGAT 15360 

CATTTAATTT TCACAACAAC CTATGAGGAA GATTCCATCA TCATCCCCAT TTTACACATA 154 20 

AAGAAACAAA TACAGAAAAG TAACAACTAG TAAGAGATGG AGCTAGGTTA TGAACCTGGG 154 80 

CCATCTGCTT CCAGAGTTGG CGTTCTTAAC CACTTTAGTA TGTCTATAAA TTAGTTTTAG 15540 

TCTCATTTAG GAAAGGAATT GCCATGAGAG AAGAGAGTCA GTGGCACTCA TGCTGATGTT 15 600 

TAAGTGCTTG ATGTTATTTC AATGTTATGG GCTGTTGCAG GTATTTCTTG GAAATGAGCT 15660 

ATTTACAGCA AGGGTGTTTG CCTCTCATTG CTGTAGTTCC CTGAGAAAAG AGCCTGTGTT 15720 

CAATGATGAG CTCCCATCCC GCATCCTGTG TGGCACTCTG TCCATCAAGC CCAGTGTGAA 15780 

GGAGTTCACG GAAACCTCAG CTGTGTTTGA GGATGGGACC ATGTTTGAGG CTATCGACTC 15840 

TGTCATCTTT GCAACAGGCT ATGATTATTC CTACCCCTTC CTTGATGAGA CCATCATGAA 15900 

AAGCAGAAAC AATGAGGTTA CCTTGTTTAA AGGCATCTTC CCCCCACTAA TGGAGAAGCC 15 960 

AACCTTGGCT GTGATTGGCT TGGTTCAGTC CCTTGGAGCT GCCATCCCCA CAGCAGACCT 1602 0 

GCAAGCCTGG TGGGCTGCTA AAGTATTTGC AAGTAGGTGG GCCATTCTGT CTTTCATTCA 16080 

TTTTATCAAT GAACATTTAC TGAACACCTG CTATATGCAA AGCACTGTGC TAGGGATACA 1614 0 

ATGAGAACAA GACAAACATG TTCCTTGACC TCTCAAGGCT TAAAATGGGG TGTGGGGGAT 16200 

GCCATAATAG GGGAAATTTG GGGGGGTTCT AGTGAGGGGA GTTGGACTGT TGCACAGAGC 162 60 

AAACAGTATA CAGGAAGTCA TAAAGGTGAG GG AAAG CAT G AAATGTGTAA GGACCCAGAA 16320 

ACATTTTGGT GGAAGGGAAT ATAAAGCAGA GGCAGGGAGT GGCAAGAAAT ATAGGTTTAT 16380 

AAGCCACGTT AAAGAGCTTA AACTTCTCAT AGGGATTAAG GACTTCGCAA GATTTTAAGC 16440 

AAGAAAAAAA TAGCAGAGGA TAACTGCAAT GTCAGGCTAC ATTATAAAGA TTGGAAGGGC 16500 

CCTGGTGAGG GTTGGAGGTG TGCCAGAAAC CTCACTGGTG TCAACTTCTG TCAGAATAAC 16560 

AAAGTCAGGC CACTCTGATT CTCATGACAA TCTTCTTCTT CTCTCCCTCT ACTCTAGACC 16620 
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TCATGGTCTC CAGGGGCTAC AAGTATGCTT ATGTGAGGAA ATCAAGAATA TGAGGATTAC 16680 

AT GG AG AAA G GCAATGTCTC AAATATATTA ATTTACTCCA GTCATACTGA ATATTATCAT 16740 

TAT TAT T G AA AAGTGTTCTT TTATTCAGGT ATTCTCCAAA ATATTGACCA ATATAGGTAT 16800 

AACTTACCTA ACATAACTAA TCCATAAAAA CTTACACTAT TGGTAATTAA CAAACCATTA 16860 

CAATCATGGA ATATATGTAT ATATATTGTC TAAAACTTTG TAGATAAATA AATTTCTATT 16920 

TCAAATACAC CATGAAAGAT CATCATTTAA ATAAACCCCA TCATGAAATC TTTTGTAAAG 16980 

GTGCTCCCTG CAAAATACTT CTATTGCCTT TTTCCTTCGA AAGGCACAAC AATGCCAAGA 1704 0 

GCCTGGGGTA TTATGAGAAG ACTGGATATA GTTCATAAAC CTAAGAAATT TACATGAAGC 17100 

AAATGGTATC ATTTATTTAT TCAGCAAATA CTTACTGAAC ACCTACTATG TGTCAGGCTC 17160 

TAACCTGGCA CTTAGGACAC AACAACAAAC GAAGCAGAAC AAAATTCTGG CCTCTTACTT 17220 

TCTAGCAGGG TGTCCAGCCA ATATCAATCA TAGGGTACTA CCAGGTTGAC ATAAGACACT 17280 

AACGATGACT GGGAAATATT CATGCACTGC AAATTTTAGA GTAACTTTCT TCCACTGTTA 17 340 

CAAAGGCAAA TAAGCTACCA TCACCAGTTA AAAGAAGTTG CATTGATGTA GTGAAATTCA 17 4 00 

CAAAAAGCTA AAACTTGTCT GCTGCCCCTT AAAACACCTT GCATAGTTGC AGAAGATGTT 174 60 

TAAAATCCTA TGCTTCCTTC CATTACCTCA TTTAAAATGG CAGAAACCTT AAAGGGAACT 17520 

GTTTTACCAG ATTCTTTCTT CAGAGAAGTT TTAGGAAAAG GATACAGAAA AAAAAGGAAG 17580 

AAATTATTAA GCTATTATAT GCATGAAGTG TACTGAGCAC ATATGTTGAG GATTAGGTCC 17 640 

TCTATAATGT TACCGAAATA AGAGACTGAG TGATTTGAAG CTACAAATGT CTCTGCTGTC 17700 

ACTATCTCAC T AC AG G CC AG CTTTTCCAAT TCCCAAAGGT TCATTAACTT TTCAGATCTT 177 60 

TGTTTCTATG AACTGGTATT TTGCTAAAGA TATCAAAGAC ATCTCCAGCT CCTCTTAATA 17 8 20 

CAAAAGTTTT CAGGAATACA GTTTATAAAA ACCAAATGAT TTCCATCATA TGTCATTATA 17 8 80 

TATTTCTGAT TTGTGTTTTT CAATATTTTT CTCTTCATTT CTTTTCTAGA CTCATGTACC 17940 

CTGCCAACCA CGAATGAAAT GATGGATGAC ACTGATGAGA AAATGGGGAA AAAACTCAAG 18000 

TGGTAAGCAG CTAACTGTAC TTGCTAATAG AGCAAGTTCC TAAAATGTGC CTTTATGTGT 18060 

AGAAAAACAT TAATATGCTT TAATATTGTC ATTAGTCAGA GTTTACATTT TCTGAACACT 18120 

TGCAATAATC AAAAAATGTT TAGATAGTAA ACAGTCATCA CACTTCTCTT GTGTAACTCA 18180 

AGAATAGAGG TTTTCTATCA GGGATAATTT TGCCCTCCAG GTGACATATG GCAAAATCTG 1824 0 
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GAGACACTTT TGGTCATTGT GAGTGGAGAG GGCATGCTAT CAGCATCTTA T GAG TAG AG A 18 300 

ACAGGGATTC TGCTAACCAT CCAACAATGC AG AG C AC AG T TCACCAAAAC AATTATCTGG 18360 

CTCAAAATGT CAATAGTGCT GAGGTTAAGA AACAACTCTA TAAATGACTA CAGTTGACCT 184 20 

TTGAACAACA CAGGTTTGAA TTATATGGGT CCACTTATAC ATGGATTTTT TCAATTAACA 184 80 

TAATGCAGAT TGGGCATGGT GGCTCACGCC TGTAATCCCA GCACTTTGTG AGGCTGAGGC 18 540 

GGGCGGATTA CCTGAGGTCA GGAGTTCGAG ACCAGTCTGG CCAACATGGT AAAACCCTGT 18 600 

CTCTACTAAA AATACAAAAA AAATTAGTCG AGTGTGGTGG TGTGCACCTG TAATCCCAGC 18 660 

TACTCGGGAG GCTGAGGCAG GGGAATTGCT TGAATCAGGG AGGTGGAGGT TGCAGTGAGC 18720 

CAAGATCGCG CCACTGCACT CTAGCCTAGG TGACAGAGTG AGACTCCATC TCACAAAAAA 18780 

AAAAAAAAAA AATGCAATTT TTTGGAGATT TGCAGCAATT TAAAAACTCA AGGCCAGGCG 188 4 0 

CGGTGGCTCA CGCCTGTAAT CCCAGCACTT CGAGAGGCCG AGGCGGGTGG ATCATGAGTT 18 900 

C AG GAG AT C A AGACCATCCT GGCTAACATG GTGAAACCCC GTCTCTACTA AAAATACACC 18 960 

AAAATTAGCC GGGCGTGGTG GCGGGTGCCT GTAGTCCCAG CTACTCGGGA CGCTGAGGCA 19020 

GGAGAATGGC GTGAACCCAG GAGGCGGACT TGCAGTGAGC CCAGATTGTG CCACTGCACT 19080 

CCAGTCTGGG CAACAGAGTG AGACTCCGTC TCAAAAAAAA AAAACCTCAA AGATGAATTG 1914 0 

TGTAGCCTAG AAATATTTTA AAAAATTAAG AAAAAGATGC CATGTATAAA ATATTTGTAG 19200 

ATACTAGTCT ATTTTATCAT T TACT AC CAT AAAATATACA CAAATCTATT ATTAAAAATT 192 60 

AAAATTTATC AAAACTAAAT GCATACAAAC TCTTAGACTA TACATGGCAC CATTCATAGT 19320 

CAACAGAAAT GTAAACAAAC ATAAAGATGC AATATTGTCA TAACTGCATA AAATATAGCA 19380 

CATAATGTGC TAGTATAATA ATTTTGCAGT CACCTCTTGT TGGTATTGCA GTGAGCTCAA 194 4 0 

GTGTTTTGAG TATCTACTTA AAATGCTGTG TGACATTAGT CATTTTCACC TGAGCAGTTC 19500 

ATATCTCCAG TAAATTCTGC CTCACAGTAA &AAGTGATCT CTCAAGGTTC TCACATATTT 195 60 

TTATCATGTT TAGTGCAATA CCTTAAGCCT TTAATAACAC CATGGGCTCC ATATGAAGTG 19620 

TCATTAATGA TGTTGGAAGT GCTCCCAAGA AGCAGAGAAA AGTTATGACA TTATAATAAA 19 680 

AAAATTGAGT TGCTTAATGT ATACTATACA TTGAGGTCTG CAGCTATAGT TGCCCACCAT 19740 

TTCAAGATAA ATGAATCCAG TGCAACTATG CCAGCAGGCA TGAAATCTTG CACTTTTTGT 19800 

AAAATATCTT TTTATTTTGG ATTGAAAATG CAGCTTTTTA TGTGGGTGCA GGATTGCTAT 198 60 
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AAGGAAGTAT ACATATAGAC TCTAATATAA TTTGAGAAAA AGTGAAGTTA TTATATGACA 19 920 

AAGCAAAAGG AAGGTGAAGG ATCTAGAGCT GGAAAAGTTA ATGCCAGCAA AGGATGATTT 19980 

GATTACATCA GAAAGAGTTT GGCTTCAAAA ATGTCAAGAT AAC AG GAG AC ACGCATGCTG 2004 0 

CCAACCAAGA AGAAGGAGAT GAATTCCCAG AT GT CAT TAT G AAAAT CAT T GAG G AG AAAG 20100 

GATTTCTGCC T G AAC AG AT T TTTAACACAG ACAAAAGTGC CCTATTCTGG AAAAAAAAAA 2 0160 

AAAAAAAAAG CCACAAAGGC CATTTATTAA TAAGGAGCAG AAGTGAGCAC CAAGATTAGG 2 0220 

CAGGAAAGAA TAAGCTAACT ACTGTTTTGT GCAAATGCAG TCAGATTTAT GATCAGGATG 20280 

GCCCCTACCT ATGAAGCTAC CCCCTCAAAC CTTGAAGGGA AAAGATGAAT ATCAGCTTCC 2 034 0 

TATCTTTTGG TTATACAAGA CCCTTTTTCT GGATTAGCTC TGTCAATGCT TTGTCCCTGA 2 04 00 

AG TC AG AAAG TCCTTGCCAA TAAGAGACTG CCTTTTAAAG TTTTTTTGAT ATAGACAATG 204 60 

CCCCTGACCA CCCAGAACCC CATGAGTTCA ACATGGAAGG CATCGAAGTA GTCTAATTTC 20520 

CCCCAAACAC AACATTCTAA TTCAGCCTTT ATATCAGGGA GTCATAAGGA CCTTTAAGGC 20580 

TCATCACATA CCATACTCTA TGGAAAAGAT AGTCAATGCT GTGGAAGATA ACCCAACAGA 2 0 640 

GAGAACATCA TGAAAGTCTG GAAGGATTAT ACCATTGAAG ATGCCCTAAT TGTTATAGAA 20700 

AAAGCCATGA AAGCCATCAA TCCTAAAACA ACATATTTCT CCTGGAGAAA ACTATGTCCA 2 07 60 

GATGTTATAT ATGACTTCAG AGGATTTACA AC AG AC C AG T CACAGAAATC ATGAAAAAGA 2 0820 

TTATGGATAT GGCAAAATAA AAAGGTGAGG GTGAAGGGTT TCAAGATATG GATCATGGAG 2 0880 

AAATTCAACA GCTAATAGAC ACCACTAATA GACACTTTTA ATTCCACACT AGAGGAACTA 2 0940 

AAAGATGACT TGATGGAGAT GAGTCCTTCC AAAGCAGTGC CAGATGAGAA CGAAGACATA 21000 

GAAAAAGCCA TGCCAGAAAT AAATTGACAT T AG AT CATC T GGCAGACAGG TTCCAGTTAT 21060 

TTAAGACTTC TTTTGACTTC TTTTATATAA CATGGACCCT TCTATGATAC AGGCACTGAA 21120 

ACT AAAG CAA ATGATAGAGG AAGGATTACT ACTATATAGA AAATTTTTAG AGAAATAAAA 21180 

AAGCAAAGTC AGACAGAAAT TATAATATAT TTCCATAATT ACACCAATGG GCCTGCCTCT 21240 

CCTGCCCCCA ATTCTACCTC CTCCATCTCT TCCGCTTCTG CCAGGCCTGA AACAGCAAGA 21300 

CCAACCCCTT CTGTTTCTCC TCCTACTCCT CAGCCTACTC AACATAAAGA TGATAAGGAT 21360 

GAAGACATTT ATGATAAACC ACTTCCACTT AATGAATAGT AAACATATTT TTTCTTCCTC 21420 

ATAATTTTCT TAATAACATT TTCTTTTCTC C AT AT TACT T TATTGTAAGA ATAGTATTTA 21480 
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ATACGTATGA CATATAAAAT ATGTGTTAAT CAACTGTTTG CATTATTGGT AAGGCTTCCA 21540 

GTCAACAGGT TATTAAGAGT TAAGTATTTG GGGAGTCAAA AGTTATACAT GGATTTTTGA 21600 

CTGCAAGAGG GCTCAATGCC CCTAACCCCT CAGTTCTTCC AAAGTCAACT GATATAGGAA 21660 

GTTTCTTTAC TTTTTCAAGC ATTTAACATT GC AT TG ATA T GTCAACCTAA AGGAAAACAC 21720 

TGAGGCAAAT TTAATATAAA AAGAGAATTG ATTTGGGCCA AGTTTGAGGA CTGCAACCCA 21780 

GGAGCACAGA GTCAAATTGC CCTGAATATG CACTCCGTTG GCAGCAGTTA CAAGTAGGTT 218 4 0 

TTTTAAAGGA AATACAAAAG AGTCAACTTC TAAGTTGTTT ACCAAGAACT TACATTAAAA 21900 

TTATATAAGC TATTGATTGG CTATATACTG TTCTTCGTAT CACAAATTCT ACGAACATGA 21960 

AGATGATGAG TGAGACAGCT AGTCAGGAAT AAAAATGCCT TTTAACAATT GCCGCCAGGC 22020 

TTGGTAGAGG GCAGCATGAC AAGTCCCATA CACGTGGCTC TCTCAGCTTG ATAAATTTTG 22080 

CATACCTCAC ATAGTGCAAA CTACTCTGAG CTATTTTTCT TCTCTCACAT TGAATGCCAC 2214 0 

AATGTAGTCA CCCATTCAGG GCCTAGAGAA GAAAAGAAAT GGAACCCTCA GATTCAACAA 22200 

AACCTCTCCT GCACAACTTC AGCCAGTTGA CGAACAACTT GCAGAGTTGG GCACTTTTAT 222 60 

GTGCTAACAA TTCATGCAGC TTGATACCCT TTCCTTTAGA GCCCAGTAGA AATAAAAATG 22320 

AGGAAATAGA GAGGTTAAAA TGTTCATCTT ATTGCTTAAA TGATAAGCTG CTCTTCAGAG 22380 

TTTCAAAAAG CAAATTACAC CATATTCCAA CTAAAAGAAC TATAGAGGCG GAAAGGAGGT 224 4 0 

GATCTCTTTT CTCTCTGTCA TAAAAGGTAA TGGCCAACAC CCCTATAACA AAAGACAGGT 22 500 

TAACAAGAGA AAACGTGACA GATTTATTAC GTGCACATGT GTGCATGAGA GCCTTACAAA 22 5 60 

ACATGAACTC AAAGGAGGGC CAGATCATTC ATGTTTAAAT ATTCTCTTCA CTGGGGTTAG 22 620 

GGGAGATGGA AGTGTAAAAG TAAATGATTT TTCAGAGGAA ATTAATAAGT CCAAAGAACA 22 680 

CAGATTAGAC CAAGTTTCTC TGGGCTTTGG GGGAGGTGTA ATCACCCAAC AGATTCATCT 2274 0 

TGCTCACTGC CCAGAAAAGC TGATGCCCTG AGAACAGCAG GTTTTTCCAA TAGAGAGAGT 22 800 

TTAATAAACA CACAGCTGTC AGAGGCATTT GAACCAGAGT GACTCCATCT TGAATAGGGG 22 8 60 

CTGGGTAAAA TGAGGCTGAG ACCCACTAGG CTGCATTCCC AGGAGGTTAG GCATTCTTAG 22 920 

TCACAGGATG AGAAAAGAGG CCAGCACAAG ATTCAGGTCA CAAAGACCTG GCTGATAAAA 22 980 

CAGGATTCAG TAACGAAGCT GGCCAAAACC CACCAAAACC AAGATGATGA AAAAAGTGAC 2304 0 

CTCTGGTCGT CCTCACTACT CATTATATGC TGATTATAAT GAATTAGCAT GCTAGAAGAC 23100 
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ACTCCCACCA GCACTGTGAT AGTTTACAAA TGCCATGGCA ATATCAGGAA GTTACCCTAT 23160 

ATAGTCTAAA AAGGGGAGGA ACCCTCAGTT CTGGGAACTG CCCATTTCTT TCCTGTAAAA 23220 

CTTATGAATA ATCCACCCCT TGTTTAACAT GTAATCAAGA AGTAACTATA AGTATACTCA 23280 

GTTGAGCAGC CCATGCCACT GCTCTGCCTA TGAAGTAGCC ATTCTTTTAT TCCTTTACTT 2334 0 

TCTTAATAAA CTCGCTTTCA CTTTATGGAC TGGCCCTGAA TTCTTTCTTG TGAGAGGTCC 234 00 

AAGAACCCTC TTTTGGGGTC TGGCCAGCTA AACGGAAGGA CAGGAGTTTA TTACTACTCA 234 60 

AATCAGCCTC CATGAAAATT CAGAGGCTAG ATTTTTTTAA GGATAGTTTG GTAGTCAGGG 23520 

GCTAGGGAAT GGGGAATGCT GATTGGTTGG GTCAGGGATG AAACCATAGG GAGTCAAAGC 23580 

TTGTCTTCTG GTCTTCCTGG GAGGAGACCA CATGACAAGA TGAACCAGTT TACCAGTCTG 2 3 640 

GGTAGTGCCA GCCGGCCCAT CAGAATGCAG GGTCTGAAAA ATATCTTGAG CACCAATGGT 23700 

AGGTTTTATA ATGGTGATGT TATCCATAGG AGCAATTGGG GACTTCTGAC TGCATGACTC 237 60 

CTGAGCCCTA ATTTCTTATC TTGTGGCTAA TTTGTTAGTT C T AC AAAAGC AGTCTGATCT 23820 

CCAAGCAAGG AGGGGGTTTG TTTTGGGAAA GGGCTGTTAC CATCTTTGTT TCAAAGTTAA 2 3880 

ACTGTAAACT AAATGTCTCC CATAGTTAGC TTGGCCTATG CTCAGGAATG AATAATGGCA 2 3940 

GCTTGGAGAT TAGAAGAAAG ATGGAGTAAT TACATTTTTT TTTCACATTT TTTTCACTGT 2 4 000 

CACAATTTTT TTAAAGGTGA TTTCAGAGGT AAC AT C AC AG GACATGGGAG ACTAAAGGGA 24 060 

GGAAAGTATG TCAAACAAAG GCTGTCCTGT TCTGCAGACG AAACCTCACA GAAAGCAACT 24120 

CTCAGAGTCA GTAGCCTATG ATGAAAGTTT CTCTGTCAGA CATTCAGCAG TGCCTGACTC 2 418 0 

TCAGTCTCTC TCTCCTGCAA GTTAATCTTT CCTAGAGTGG GCAAGGGAGG CCTCCGAGAA 2 4 240 

AGCCTAGTTT CCATCTTCTG TTTACTTCCT TTTATTTTCT CCACAGATAA AAATCTCCTT 2 4 300 

CACAAAAGGC AGCTTTTCAG GGCTGTTTCT GTCTGCAGGC CCTCTGAATA GCCATCTCAA 2 4 360 

AATCTGTCAA CGAAGTGTAT ATTTTGCAGT AAAATATTTT TTGTTTTCTT TAGTATGAAA 24 4 20 

CAATTTATAT TATTAGATTA CAGGAGTATT AAAACCATCC ATGATCTCAC TTTTAAACAA 24 480 

ACCAATCTGA AAGTCTAACA TTGGGGCAGA TTCTAAGCAA TGTCTTATAA AGAATAATTA 2 4 540 

TGTGTTAATG AGTAAACTAA GTTAATTAGT CTCCTTAAAC CAGAGGGTCA GTTTACTCCA 2 4 600 

GGCCACATGG TCAAAGGCAA AAGTCCAACA TTACATCAAA CTCAAATAGA GATTAGGAAG 2 4 660 

GAGGAGAAAA GCAGCTCACT TAGCTAAAGA AAAAACAATA AATTCAATTT TGTGGAAAAG 24 720 
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GAGGGCATAA ATGGAGGTGC TATCTAAAAT GTTATTTTTC TGAAAGAAAA 
TAATGCTCCT ATTTGCAACT GTAACACTTA TTCCAGTATG TTCTCTTCTT 
TGGCCAGAGC CAGACTTTGC AGACAGATTA CATCACATAT GTGGATGAGC 
CATAGGGGCC AAGCCTAACA TACCATGGCT CTTCCTGACA GATCCCCGCC 
GGTGTACTTT GGCCCTTGCA GCCCATACCA GTTTCGACTG ATGGGACCAG 
TGGGGCCAGA AATGCCATCC TGACCCAGTG GAACCGGACA GTGAAGCCAA 
AGTTGTCAGT GAAGTTCAGC GACCCCATCC CTTTTACAAT TTGCTTAAAA 
CCCATTACTC CTTCTGGCTG TTACACTTAC ATTTTATTAA TGAGAAAGTC 
CAAAATTCAG CATAGAAGTG TAATCACACA ATACAACACA CACCACACAT 
AATCACAACA TAGTTCCTCT CTCCTTTCCT GAAGATATGA AAATCAGTCT 
GAATTAAAGT ATAAGTAAAA TGGAAAATAC TCAGCCTCTC TCTCTCTGTT 
TCTCTAAAAG GCTTTTCACA TGCTGAATTG GCAAATTTGG GGATGCTTAA 
GAAGTTGAAT AAGCATGAGC ACAG 
(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1605 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

GCAATCATGA GCAAGAGGGT TGGCATCATC GGAGCTGGAG TCAGTGGCTT GGCTGCCATA 60 

TGGTGCTGTC TGGAGGAGGG GCTGGAGCCC ACTTGCTTTG AAAGGAGCGA TGATGTTGGA 120 

GGCCTGTGGA AATTCTCAGA CCACACAGAA GAAGGCAGAG CCAGCATTTA CCAGTCTGTA 180 

TTCACAAACT CTTCCAAAGA AATGATGTGC TTTCCAGACT TCCCTTATCC GGATGATTAC 24 0 

CCAAACTATA TACACCACAG CAAGCTCCAG GAATATATAA AG AC AT AT GC TCAAAAGAAG 300 

GAACTTTTAA GATACATANA GTTTGAGACC CTGGTTTCCG GTATAAAGAA ATGTCCCAGC 360 

TTCTTAGTCA CGGGCCAATG GGTTGTTGTT ACTGAAAAGG ATGGGAAACA GGAATCTACT 4 20 

ATTTTTGATG CTGTAATGAT TTGTTCAGGA CATCACGTAT ACCCCAATCT GCCAACGGAT 4 80 
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TCCTTTCCTG GCCTGGACCA GTTTCGAGGC AACTACCTCC ATAGCCGGGA TTATAAGAAT 54 0 

CCAGAAGCCT TCAAGGGGAA GAGGGTCCTC GTGATTGGTC TGGGGAATTC GGGATCTGAC 600 

ATTGCTGTTG AGCTCAGCCG TCTGGCTACA CAGGTCATTA TCAGTACCAG AAGTGCTTCC 660 

TGGGTCATGA GTCGGGTCTG GGATGATGGC TATCCTTGGG ATATGATGTA TGTTACCCGC 720 

TTTGCATCCT TTCTCCGGAA TGTCCTTCCT TCATTCATCT CTGACTGGTT ATATGTCCAG 780 

AAGATGAACA CGTGGTTTAA GCATGAGAAC TATGGCCTGA TGCCTTTAAA TGGTTCCCTG 84 0 

AG AAAAG AG C CTGTGTTCAA TGATGAGCTC CCATCCCGCA TCCTGTGTGG CACTCTGTCC 900 

ATCAAGCCCA GTGTGAAGGA GTTCACGGAA ACCTCAGCTG TGTTTGAGGA TGGGACCATG 960 

TTTGAGGCTA TCGACTCTGT CATCTTTGCA ACAGGCTATG ATTATTCCTA CCCCTTCCTT 1020 

GATGAGACCA TCATGAAAAG CAGAAACAAT GAGGTTACCT TGTTTAAAGG CATCTTCCCC 108 0 

CCACTAATGG AGAAGCCAAC CTTGGCTGTG ATTGGCTTGG TTCAGTCCCT TGGAGCTGCC 114 0 

ATCCCCACAG CAGACCTGCA AGCCTGGTGG GCTGCTAAAG TATTTGCAAA CTCATGTACC 1200 

CTGCCAACCA CGAATGAAAT GATGGATGAC ACTGATGAGA AAATGGGGAA AAAACTCAAG 12 60 

TGGTTTGGCC AGAGCCAGAC TTTGCAGACA GAT T AC AT C A CATATGTGGA TGAGCTGGGC 1320 

TCTTTCATAG GGGCCAAGCC TAACATACCA TGGCTCTTCC TGACAGATCC CCGCCTGGCC 1380 

CTGGAGGTGT ACTTTGGCCC TTGCAGCCCA TACCAGTTTC GACTGATGGG ACCAGGGAAG 14 4 0 

TGGGATGGGG CCAGAAATGC CATCCTGACC CAGTGGAACC GGACAGTGAA GCCAACCAGG 1500 

ACAAGAGTTG TCAGTGAAGT TCAGCGACCC CATCCCTTTT ACAATTTGCT TAAAATGCTT 15 60 

TCATTCCCAT TACTCCTTCT GGCTGTTACA CTTACATTTT ATTAA 1605 

(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 532 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 

Met Ser Lys Arg Val Gly lie lie Gly Ala Gly Val Ser Gly Leu Ala 
15 10 15 

Ala lie Trp Cys Cys Leu Glu Glu Gly Leu Glu Pro Thr Cys Phe Glu 
20 25 30 

Arg Ser Asp Asp Val Gly Gly Leu Trp Lys Phe Ser Asp His Thr Glu 
35 40 45 

Glu Gly Arg Ala Ser He Tyr Gin Ser Val Phe Thr Asn Ser Ser Lys 
50 55 60 

Glu Met Met Cys Phe Pro Asp Phe Pro Tyr Pro Asp Asp Tyr Pro Asn 
65 70 75 80 

Tyr He His His Ser Lys Leu Gin Glu Tyr He Lys Thr Tyr Ala Gin 
85 90 95 

Lys Lys Glu Leu Leu Arg Tyr He Gin Phe Glu Thr Leu Val Ser Gly 
100 105 110 

He Lys Lys Cys Pro Ser Phe Leu Val Thr Gly Gin Trp Val Val Val 
115 120 125 

Thr Glu Lys Asp Gly Lys Gin Glu Ser Thr He Phe Asp Ala Val Met 
130 135 140 

lie Cys Ser Gly His His Val Tyr Pro Asn Leu Pro Thr Asp Ser Phe 
145 150 155 160 

Pro Gly Leu Asp Gin Phe Arg Gly Asn Tyr Leu His Ser Arg Asp Tyr 
165 170 175 

Lys Asn Pro Glu Ala Phe Lys Gly Lys Arg Val Leu Val He Gly Leu 
180 185 190 

Gly Asn Ser Gly Ser Asp He Ala Val Glu Leu Ser Arg Leu Ala Thr 
195 200 205 

Gin Val He He Ser Thr Arg Ser Ala Ser Trp Val Met Ser Arg Val 
210 215 220 

Trp Asp Asp Gly Tyr Pro Trp Asp Met Met Tyr Val Thr Arg Phe Ala 
225 " ~ 230 235 240 

Ser Phe Leu Arg Asn Val Leu Pro Ser Phe He Ser Asp Trp Leu Tyr 
245 250 255 

Val Gin Lys Met Asn Thr Trp Phe Lys His Glu Asn Tyr Gly Leu Met 
260 265 270 
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Pro Leu Asn Gly Ser Leu Arg Lys Glu Pro Val Phe Asn Asp Glu Leu 
275 280 285 

Pro Ser Arg He Leu Cys Gly Thr Leu Ser He Lys Pro Ser Val Lys 
290 * 295 300 

Glu Phe Thr Glu Thr Ser Ala Val Phe Glu Asp Gly Thr Met Phe Glu 
305 310 315 320 

Ala He Asp Ser Val He Phe Ala Thr Gly Tyr Asp Tyr Ser Tyr Pro 
325 330 335 

Phe Leu Asp Glu Thr He Met Lys Ser Arg Asn Asn Glu Val Thr Leu 
340 345 350 

Phe Lys Gly He Phe Pro Pro Leu Met Glu Lys Pro Thr Leu Ala Val 
355 360 365 

lie Gly Leu Val Gin Ser Leu Gly Ala Ala He Pro Thr Ala Asp Leu 
370 375 380 

Gin Ala Trp Trp Ala Ala Lys Val Phe Ala Asn Ser Cys Thr Leu Pro 
385 390 395 400 

Thr Thr Asn Glu Met Met Asp Asp Thr Asp Glu Lys Met Gly Lys Lys 
405 410 415 

Leu Lys Trp Phe Gly Gin Ser Gin Thr Leu Gin Thr Asp Tyr He Thr 
420 425 430 

Tyr Val Asp Glu Leu Gly Ser Phe lie Gly Ala Lys Pro Asn lie Pro 
435 440 445 

Trp Leu Phe Leu Thr Asp Pro Arg Leu Ala Leu Glu Val Tyr Phe Gly 
450 455 460 

Pro Cys Ser Pro Tyr Gin Phe Arg Leu Met Gly Pro Gly Lys Trp Asp 
465 470 475 480 

Gly Ala Arg Asn Ala He Leu Thr Gin Trp Asn Arg Thr Val Lys Pro 
485 490 495 

Thr Arg Thr Arg Val Val Ser Glu Val Gin Arg Pro His Pro Phe Tyr 
500 505 510 

Asn Leu Leu Lys Met Leu Ser Phe Pro Leu Leu Leu Leu Ala Val Thr 
515 * 520 525 

Leu Thr Phe Tyr 
530 



5DOCID: <WO 98249 14A1_I_> 



WO 98/24914 



89 



(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc - "oligonucleotide" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 
T C AC AT AG AG TGCTATGGGG G 

(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 25 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "oligonucleotide 



(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 8: 
CTTAGGAAGA AGATAAAAAT GCAAC 
(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "oligonucleotide" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 
AATGTCCATC ATCATAGTTC TCT 
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(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc - "oligonucleotide 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 
TAGGCTTGTG TAGCCTGCCC TCA 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "oligonucleotide 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
CCTCAGAGAG AACTAT 

(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : Autre acide nucleique 

(A) DESCRIPTION: /desc - "oligonucleotide 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 
GGAGTCTCTC TTGATA 



DOCID: <WO 982491 4A1 J _> 



WO 98/24914 



91 



(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "oligonucleotide 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 
CCTCAAAGAG AACTAT 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "oligonucleotide 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 
GGAGTTTCTC TTGATA 
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REVEND I CATIONS 

1. Sequence nucleot idique isolee, caracterisee en 
ce qu'elle est choisie parmi ; 

5 a) les sequences codant pour la proteine FM02 ou FMOx 
humaine et leurs variants proteiques, 

b) les sequences codant pour un fragment de 1 1 une de ces 
proteines ayant au moins 10 bases, 

c) les sequences genomiques FM02 ou FMOx humaines et leurs 
10 alleles, 

d) les sequences presentant au moins 80 % d'homologie avec 
les sequences (a) et (c) , 

e) les fragments des sequences (c) ou (d) ayant au moins 10 
bases , 

15 f) les sequences qui s ' hybrident avec une sequence de (a) a 
(e) . 

2. Sequence nucleot idique caracterisee en ce 
qu'elle est choisie parmi : 

20 a) les sequences codant pour un polypeptide comprenant les 
amino-acides selon la sequence SEQ ID N° 3, ou selon la 
sequence SEQ ID N° 6, 

b) les sequences nucleiques SEQ ID N° 1, SEQ ID N° 2, ou 
les sequences nucleotidiques representees Figures 2 et 1, 

25 les sequences nucleotidiques SEQ ID N° 4, SEQ ID N° 5, ou 
les sequences nucleotidiques representees Figure 10, ou les 
sequences nucleotidiques codant pour les polypeptides 
correspondants , 

c) un fragment d'une sequence selon (a) ou (b) comportant 
30 au moins 10 bases, 

d) une sequence qui comporte par rapport aux sequences (a) , 
(b) ou (c) au moins une mutation ponctuelle, et 

e) une sequence complementaire des sequences (a) , (b) , (c) 
ou (d) . 
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3. Sequence nucleotidique selon l'une des 

revendications 1 ou 2 , caracterisee en ce qu'elle comprend 
au moins la mutation G . 1263mac . A. 



5 4. Sequence nucleotidique selon l'une des 

revendications 1 a 3, caracterisee en ce qu'elle comporte 
au moins 10 bases. 



5. Sequence nucleotidique utilisable notamment 

10 comme amorce specif ique d'un allele caracterise en ce que 

sa sequence est choisie parmi les sequences selon la 
revendication 4. 



6. Sequence nucleotidique utilisable notamment 

15 comme amorce nucleique caracterisee en ce que sa sequence 
est choisie parmi les sequences selon la revendication 4 et 
les sequences SEQ ID N° 7, SEQ ID N° 8, SEQ ID N° 9 et SEQ 
ID N° 10. 



20 7. Sequence nucleotidique utilisable notamment 

comme sonde specif ique d'un allele caracterisee en ce que 
sa sequence est choisie parmi les sequences selon la 
revendication 4 et les sequences SEQ ID N° 11, SEQ ID N° 
12, SEQ ID N° 13 et SEQ ID N° 14. 

25 

8. Sequence nucleotidique selon la revendication 1 / 

caracterisee en ce _que la sequence code pour 1 1 un des 
domaines de FMO. 



30 9. Polypeptide code par une sequence nucleotidique 

selon l'une des revendications 1 a 4, et 8, notamment les 
polypeptides de sequence SEQ ID N° 3 ou SEQ ID N° 6 . 

10. Vecteur de clonage et/ou d' expression dans une 

35 cellule hote appropriee d'une sequence nucleotidique, 
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caracterise en ce qu'il comporte une sequence selon 1 ■ une 
des revendications 1 a 3 et 8 . 

11- Vecteur selon la revendication 10, caracterise 

5 en ce qu'il comporte les elements permettant 1' expression 
et/ou la secretion desdites sequences dans ladite cellule 
hote . 

12. Vecteur selon 1 1 une des revendications 10 et 11, 
10 caracterise en ce qu'il s ' agit d'un vecteur a replication 

autonome . 

13. Vecteur selon 1 1 une des revendications 10 et 11, 
caracterise en ce qu'il s ' agit d'un vecteur d' integration 

15 chromosomique . 

14. Vecteur selon 1 1 une des revendications 10 a 13, 
caracterise en ce qu'il s'agit d'un vecteur viral. 

20 15. Vecteur selon la revendication 14, caracterise 

en ce que le vecteur est realise sur la base d'un 
adenovirus, d'un AAV, d'un retrovirus, d'un poxvirus ou 
d'un virus herpetique. 

25 16. Cellule transformee par un vecteur selon 1 1 une 

des revendications 10 a 15. 

17. Cellule selon la revendication 16, caracterisee 
en ce qu'il s'agit d'une cellule procaryote. 

30 

18. Cellule selon la revendication 16, caracterisee 
en ce qu'il s'agit d'une cellule eucaryote . 

19. Animal, caracterise en ce qu'il contient une 
35 cellule selon 1 ' une des revendications 16 a 18. 



DOCID: <WO 98249 14A1_L> 



WO 98/24914 PCT/FR97/02226 

95 



20. Procede de production de polypeptide 
recombinant, caracterise en ce qu'on cultive une cellule 
selon l'une des revendicat ions 16 a 18 et en ce que 1 1 on 
recupere la proteine produite. 

5 

21. Polypeptide susceptible d 1 etre obtenu par la 
mise en oeuvre du procede selon la revendication 20. 

22. Polypeptide specif ique de la forme mutee d'un 
10 polypeptide selon la revendication 21, caracterise en ce 

que sa sequence est choisie parmi les sequences 
polypeptidiques comprenant au moins une mutation. 

23 . Anticorps diriges contre un polypeptide selon 
15 l'une des revendications 9, 21 et 22 . 

24 . Anticorps polyclonaux ou monoclonaux selon la 
revendication 23, caracterises en ce qu'ils sont obtenus 
par reaction immunologique d'un organisme humain ou animal 

20 avec un agent immunogene constitue par un polypeptide selon 
l'une des revendications 9, 21 et 22. 

25. Anticorps polyclonaux ou monoclonaux selon la 

revendication 24, caracterises en ce qu'ils sont obtenus 
25 par reaction immunologique d'un organisme humain ou animal 
a un agent immunogene constitue par un polypeptide selon la 
revendication 22. 



26. Anticorps selon l'une des revendications 23 a 
30 25, caracterise en ce qu'il s'agit d'un anticorps marque, 

notamment pour 1 1 imagerie . 

27. Utilisation de cellules selon l'une des 



revendications 16 a 18 ou d'un animal selon la 
35 revendication 19, pour la selection de produits impliques 
directement ou indirectement dans l'activite FMO . 
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28. Utilisation de cellules selon 1 1 une des 
revendications 16 a 18 ou d'un animal selon la 
revendication 19, pour la selection de produits 
interagissant avec la FMO naturelle ou mutee, notamment a 

5 titre d'agoniste ou d ' antagoniste de cette enzyme. 

29. Produit obtenu par la mise en oeuvre de 1 1 une 
des revendications 27 ou 28. 

10 30. Methode de diagnostic d'une predisposition a des 

troubles lies a FMO chez un patient, caracterisee en ce 
qu 1 on determine a partir d'un prelevement biologique dudit 
patient la presence d'une mutation dans le gene FMO par 
1 1 analyse de tout ou partie d'une sequence nucleique 

15 correspondant audit gene, la presence d'au moins une telle 
mutation etant indicative d'une predisposition dudit 
patient a des troubles lies a FMO. 

31. Methode de diagnostic selon la revendication 30, 
20 caracterisee en ce que la mutation que l'on cherche a 

determiner est la mutation G.1263mac.A. 

32. Methode selon 1 * une des revendications 30 ou 31, 
dans laquelle la sequence d'acide nucleique analysee est un 

25 ADN genomique, un ADNc ou un ARNm. 

33. Methode selon 1 ' une des revendications 30 a 32, 
caracterisee en ce que ladite analyse est realisee par 
hybridation . 

30 

34. Methode selon 1 ' une des revendications 30 a 33, 
caracterisee en ce que la presence d'une mutation est 
detectee par comparaison avec la sequence correspondante 
naturelle non mutee. 

35 
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35. . Methode selon 1 1 une des revendications 33 et 34, 
caracterisee en ce que ladite hybridation est realisee a 
1 ' aide d 1 au moins une sonde oligonucleot idique specif ique 
de 1' allele. 

5 

36. Methode selon 1 1 une des revendications 30 a 35, 
caracterisee en ce que ladite analyse est realisee par 
sequencpage . 

10 37. Methode selon 1 1 une des revendications 30 a 35, 

caracterisee en ce que ladite analyse est realisee par 
migration electrophoret ique , et plus particulierement par 
SSCP ou DGGE. 

15 38. Methode selon 1 1 une des revendications 30 a 35, 

caracterisee en ce que ladite analyse est realisee par une 
methodologie visant a detecter une troncation de la 
proteine . 

20 39. Methode selon l'une des revendications 3 0 a 38, 

caracterisee en ce que tout ou partie de la sequence 
nucleique du gene FMO est amplifiee prealablement a la mise 
en evidence de la ou des mutations. 

25 40. Methode selon la revendication 39, caracterisee 

en ce que 1 ' amplification est realisee par PCR ou PCR-like. 

41. Methode selon l'une des revendications 39 ou 40, 
caracterisee en ce que les amorces choisies pour realiser 

30 1 • amplification sont choisies parmi les amorces definies 
selon l'une des revendications 5 ou 6 . 

42. Reactif pour detecter et/ou identifier une 
mutation du gene FMO dans un echantillon biologique, 

35 caracterise en ce qu'il comprend une sonde dite de capture 
et/ou une sonde dite de detection, 1 1 une au moins de ces 
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sondes comportant une sequence selon l'une des 
revendicat ions 1 a 8, ou en ce qu'il comporte un anticorps 
selon l'une des revendicat ions 23 a 26. 

5 43. Methode de diagnostic d'une predisposition a des 

troubles lies a FMO chez un patient, caracterisee en ce 
qu'on determine a partir d'un prelevement biologique dudit 
patient la presence d'une FMO mutee. 

10 44. Methode selon la revendicat ion 44, caracterisee 

en ce qu'elle utilise un anticorps mono ou polyclonal selon 
l'une des revendications 23 a 26. 

45. Methode selon l'une des revendications 43 ou 44, 
15 caracterisee en ce que la detection est effectuee par un 

procede ELISA ou RIA. 

46. Methode de diagnostic d'une predisposition a des 
troubles lies a FMO chez un patient, caracterisee en ce 

20 qu'on determine a partir d'un prelevement biologique dudit 
patient l'activite enzymatique d'au moins une FMO. 

47. Composition therapeutique caracterisee en ce 
qu'elle comporte a titre de principe actif au moins un 

25 compose capable de moduler l'activite FMO. 

48. Composition therapeutique selon la revendication 
47, caracterisee en ce que le principe actif est capable de 
moduler l'activite FM02 et/ou FMOx. 

30 

49. Composition therapeutique caracterisee en ce 
qu'elle comporte a titre de principe actif au moins un 
compose capable d'interagir avec FMO. 



DOC ID: <WO 9824914A1_I_> 



WO 98/24914 



99 



PCT/FR97/02226 



50. Composition therapeutique selon la revendicat ion 49, 
caracterisee en ce que le principe actif est capable 
d'interagir avec FM02 et/ou FMOx. 

5 51. Composition therapeutique selon 1 1 une des 

revendicat ions 47 a 50, caracterisee en ce qu'elle presente 
une activite differente sur FMO normale et FMO 
pathologique . 

10 52. Composition therapeutique selon 1 1 une des 

revendications 47 a 51, caracterisee en ce qu'elle comporte 
a titre de principe actif un compose a activite pro-FMO. 

53. Composition , selon la revendication 52, 
15 caracterisee en ce que le compose a activite pro-FMO est 

choisi parmi les composes suivants : 

a) une proteine ou un polypeptide selon la revendication 
29, 

b) un vecteur d' expression selon 1 1 une des revendications 
20 10 a 15, 

c) une sequence nucleotidique selon 1 1 une des 
revendications 1 a 4, caracterisee en ce que ladite 
sequence est une sequence sens induisant 1' expression de 
FMO . 

25 

54. Composition therapeutique selon 1 1 une des 
revendications 47 a 51, caracterisee en ce qu'elle comporte 
a titre de principe actif un compose a activite anti-FMO. 

30 55. Composition selon la revendication 54, 

caracterisee en ce que le principe actif est choisi parmi 
les composes suivants : 

a) un anticorps anti-FMO, selon l'une des revendications 23 
a 26, 

35 b) un vecteur d' expression selon l'une des revendications 
10 a 15, 
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c) une . sequence nucleotidique selon 1 ' une des 
revendications 1 a 4, caracterisee en ce que ladite 
sequence est une sequence antisens inhibant 1' expression de 
FMO, 

5 d) une sequence nucleotidique selon 1 1 une des 
revendications 1 a 4, caracterisee en ce que ladite 
sequence est une sequence sens inhibant 1' expression de 
FMO. 

10 56. Composition selon la revendication 49, 

caracterisee en ce que le principe actif est une sequence 
soluble interagissant avec FMO. 

57. Utilisation d'un principe actif capable de 
15 moduler l'activite FMO, l'activite FM02 et/ou FMOx, pour 

realiser un medicament destine au traitement et/ou a la 
prevention de troubles lies a FMO. 

58. Utilisation d'un principe actif capable 
20 d'interagir avec FMO, avec FM02 et/ou FMOx, pour realiser 

un medicament destine au traitement et/ou a la prevention 
de troubles lies a FMO. 

59. Utilisation d'au moins un produit selon la 
25 revendication 29, pour realiser un medicament destine au 

traitement et/ou a la prevention de troubles lies a FMO, a 
FM02 et/ou a FMOx. 

60. Procede de biodegradation ou de biosynthese de 
30 compose organique ou inorganique, caracterise en ce qu ' il 

met en oeuvre un polypeptide selon 1 * une des revendications 
9, 21 et 22 ou une cellule selon l'une des revendications 
16 a 18. 

35 61. Procede d 1 elaboration de compose d'interet, 

caracterise en ce qu'il utilise un polypeptide selon 1 1 une 
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des revendications 9, 21 et 22 ou une cellule selon 1 ' une 
des revendications 16 a 18. 

62. Produit susceptible d'etre obtenu par un procede 
5 selon l'une des revendications 60 et 61. 

63. Utilisation de polypeptide selon l'une des 
revendications 9, 21 et 22, ou d 1 une cellule selon l'une 
des revendications 16 a 18 pour la detoxification de 

10 compose xenobiot ique . 
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MetAlaLysLysValAlaValXleGlyAlaGlyValSerGlyLeuIleSerLeuLysCys 
ATGGCAAAGAAGGTAGCTGTGATTGGAGCTGGGGTCAGTCGCCTAATTTCTCTGAACTCC 

CysValAspGluGlyLeuGluProThrCysPheGluArgThrGluAspIleClyGlyVal 
TGTGTGGATGAGGGACTTGAGCCCACTTGCTTTGAGAGAACTGAAGATATTGGAGGAGTG 

TrpArgPheLysGluAsnValGluAspGlyArgAlaSerlleTyrGlnSerValValThr 
TGGAGGTTCAAAGAGAATGTGGAAGATGGCCGAGCAACTATCTATCAATCTGTCGTTACC 

AsnThrSerLysGluMetSerCysPheSerAspPheProMetProGluAspPheProAsn 
AACACCAGCAAAGAAATCTCCTGTTTCAGTGACTTTCCAATCCCTGAAGATTTTCCAAAC 

PheLeuHisAsnSerLysLeuLeuGluTyrPheArgllePheAlaLysLysPheAspLeu 
TTCCTGCATAATTCTAAACTTCTGGAATATTTCAGGATTTTTGCTAAAAAATTTGATCTG 

LeuLysTyrlleGlnPheGlnThrThrValLeuSerValArgLyaCysProAspPheSer 
CTAAAATATATTCAGTTCCAGACAACTGTCCTTAGTGTGAGAAAATGTCCAGATTTCTCA 

SerSerGlyGlnTrpLysValValThrGlnSerAsnGlyLysGluGlnSerAlaValPhe 
TCCTCTCGCCAATGGAAGCTTCTCACTCAGAGCAACGGCAAGGAGCAGAGTGCTGTCTTT 

AspAlaValMetValCysSerGlyHisHisIleLeuProHialleProLcuLysSerPhe 
GACGCAGTTATGGTTTGCAGTGGCCACCACATTCTACCTCATATCCCACTGAAGTCATTT 

ProGlyMetGluArgPheLysGlyGlnTyrPheHisSerArgGlnTyrLysHisProAsp 
CCAGGTATGGAGAGGTTCAAAGGCCAATATTTCCATAGCCGCCAATACAAGCATCCAGAT 

GlySerCluGlyLysArglleLeuVallleGlyMetGlyAsnSerGlySerAspIleAla 
GGATCTGAGGGAAAACGCATCCTGGTGATTGGAATGGGAAACTCGGGCTCAGATATTGCT 

ValGluLeuSerLysAsnAlaAlaGlnValPhelleSerThrArgHisGlyThrTrpVal 
GTTGAGCTGAGTAAGAATGCTGCTCAGGTTTTTATCAGCACCAGGCATGGCACCTGGCTC 

MetSerArglleSerGluAspGlyTyrProTrpAspSerValPheHisThrArgPheArg 
ATGAGCCGTATCTCTGAAGATGGCTATCCTTGGGACTCAGTCTTCCACACCCGGTTTCGT 

SerMetLeuAroAsnValLeuProArgThrAlaValLysTrpMetlleGluClnGlnMec 
TCTATCCTCCCCAATGTACTGCCACGAACAGCTGTAAAATGGATGATAGAACAACAGATG 

AsnArgTrpPheAsnHisGluAsnTyrGlyLeuGluProGlnAsnLysTyrlleMetLys 
AATCGCTGGTTCAACCATGAAAATTATGGCCTTGAGCCTCAAAACAAATACATTATGAAG 



Figure 1 
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GluProValLeuAsriAspAspValProSerArgLeuLeuCysGlyAlalleLysValLys 
GAACCTGTACTAAATGATGATGTCCCAAGTCGTCTACTCTCTGGAGCCATCAAGCTGAAA 900 

SerThrValLysGluLeuThrGluThrSerAlallePheGluAspGlyThrValGluGlu 

TCTAC AGTGAAAGAGCTC AC AGAAACTTCTGCCATCTTTGAGGATGGAAC AGTGGAGG AG 960 

AsnlleAspValllellePheAlaThrGlyTyrSerPheSerPheProPheLeuGluAsp 
AACATTGATGTC ATC ATTTTTGCAACAGGATATAGTTTCTCTTTTCCCTTCCTTG AAGAT 1020 

SerLeuValLysValGluAsnAsnMetValSerLeuTyrLysTyrllePheProAlaHia 

TC A C T C G TT AAAG T AG A G AAT AAT ATG GTC TC ACT GT AT AAAT AC AT ATTC CC C G CTC AC 1080 

LeuAspLysSerThrLeuAlaCysIleGlyLeuIleGlnProLeuGlySerllePhePro 
CTGGACAAGTCAACCCTCGCGTGCATTGGTCTCATCCAGCCCCTAGGTTCCATTTTCCCA 1140 

ThrAlaGluLeuGlriAlaArgTrpValThrArgValPheLysGlyLeuCysSerLeuPro 
ACTCCTGAACTTCAACCTCGTTGGGTGACAAGAGTTTTCAAAGCCTTCTCTAGCCTCCCC 1200 

SerCluArgThrMecMetMetAspIlelleLysArgAsnGluLysArglleAspLeuPhe 

TC AG AG AGAACTATG ATG ATGG AC ATT ATC AAAAGGAATGAAAAAAG AATTGACCTGTTT 1260 

GlyGluSerGlnSerGlnThrLeuGlnThrAsnTyrValAspTyrLeuAspGluLeuAla 
GGAGAAAGCCAGAGCCAGACGTTGCAGACCAATTATGTTGACTACTTGGACGAGCTCGCC 1320 



I^euCluIleGlyAlaLysProAspPheCysSerLeuLeuPheLysAspProLysLeuAla 



1380 



ValArgLeuTyrPheGlyProCysAsnSerTyrxxxTyrArgLeuValGlyProGlyGIn 
GTGAGACTCTATTTCGGACCCTGCAACTCCTATNAGTATCCCCTGGTTGGGCCTGGGCAA 144 0 

TrpG luG ly PheAr g AsnAl all ePheThr G InLy aG InAr g 1 1 eLeuLy s Pr oLeuLy s 
TGGGAAGGATTC AGAAATGCCATCTTCACCCAGAAGCAAAGAATACTGAAGCC ACTC AAG 15 00 

ThrArgAlaLeuLysAspSerSerAsnPheSerValSerPheLeuLeuLysIleLeuGly 
ACTCGGGCCCTGAAGGATTCATCTAATTTCTCAGTTTCTTTTCTGTTGAAAATCCTGGGC 1560 

LeuLeuAlaValVal ValAla PhePheCysGlnLeuGlnTrpSer* * * 

3CCTTTTTTTCCC AACTTC AATGGTCCT AG 1608 



Figure 1 (suite) 
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CACAGAAGTT ATGGAACTAT ATATNTNACA CAGCNAATGC AGATGGGTTC ATACAAAAAA 
10 20 30 40 50 60 

AAAATTGAGT CATAGGCGAG GGAAGAGAAA ACCAGTTTGG TTGTTATTTC TCTAAGGTAT 
70 80 90 100 110 120 

AAGGCAACTT AATGAGAGAA CTTGTTGGTT TGTTATTTCT CTAAGGTGTA AGGCAACTTA 
130 140 150 160 170 180 

ATGAGAGAAC TTGTTGGTTT GTTATTTCTC TAAGGTGTAA GGCAACTTAA TGAGAGAACT 
190 200 210 220 230 240 

TGTCCTCACA ACTCTGTGCT TCTCAAAAAG TACCATGTGG TTTTAAGGAG TTTTCTGTTG 
250 260 270 280 290 300 

AAATATGTAA CAGAAAGTTA AAAATGAAGG AG G AG AT AC C AGGGCTGATA TGTATATTGT 
310 320 330 340 350 360 

TCTTATGATA ATATACACAA TTAAGGGAGC 7TGGACTCAT CCAAGAATGG TTCAGGGGGG 
370 380 390 400 410 420 

TGACTATGGG GCCCCTAACC ATGTAGAGGG GTGAAGGGGG CCAACACCCT CTTATTCTCC 
430 440 450 460 470 4B0 

TATAGTAACC GGAGTATTTT C AAATCC AAA TACTTCTCAG CATTTTTATG CCTATCTTAA 
490 500 510 520 530 540 

AACTTTAATT GATGATAAGA TTTCACATCT CAGACCCTAG ACTCTTGCAG TTAGTGACAT 
550 560 570 560 590 600 

TACTCCTCTT TCACATGCTG CCTGAATTCC TCTCTTATCC ACTAACAAGT GGTCATCTAA 
610 620 630 640 650 660 

CCTTTGTTTG ATATTTACAG TGATAGGGAG TTCACTACTA TACAAAACAA CTCACTCTAT 
670 680 690 700 710 720 

ATTTGTACAG CACGGTTGGC TAGAAAGTTC TTTCTCACAT TGAGACAAAC TCAGTTTTTT 
730 740 750 760 770 780 

TGTATCATTA ACATATGTAA TCCTAGAGAG ACTTGTTTCT ACCCAAAATA GGCTTCTATG 
790 800 810 820 830 840 

ACCTTTTCTG TATAGGAACC TTCTTGAAGG CAATTGTCAT GGATTTTTCA ATATCTCCTC 
850 860 870 880 890 900 

TAGGCTAAGC ATCAGAAGTT TCTTCAGTGG CCCCTTATGT GACATGGCTT TAAGAAGTTC 
910 920 930 940 950 960 

ATTGCCATCT TGGTTATTCT TAAATTCTCT GGTAGCTAAG CCAAGCTTAT TTCCACATGC 
970 980 990 1000 1010 1020 

GTGAAAGATG GATGGGTGGT AAGGCCTATG GTCCTGAACT AGTAAATGAA TTAACATATG 
1030 1040 1050 1060 1070 1080 

TGAAAGTATT TTTACAACTT AAAACACTTT GTAAACACAA GATACTATTA AAACATATCT 
1090 1100 1110 1120 1130 1140 

CCTTCATAGA AGGCAACTTG GCAAAGCATA TTAGAAACTT GCAACTCAAA ATATG GTCT A 
1150 1160 1170 1180 1190 1200 

AGGGTACACC TGGCATCACC TGGAAGCTTG CAAGAAACAA TTTCAGGCCC ACCTCATATC 
1210 1220 1230 1240 1250 1260 

C ATT AAATCC CACCTGCATT TTGACAAGAT CTCCAAGTGT TTCATTTGCA CATTAAAGTC 
1270 1280 1290 1300 1310 1320 

TGAGGAGCTC TGTAAACTTA AAAATATGCA AACACTTTCA CTAAGCAATC CTTGTTTT T A 
1330 1340 1350 1360 1370 1380 

GGTATTTATC CTGAGAAAAT GATTAGGTTA AGTACACAGC ATTTTTATAA CAGCAAAATC 
1390 1400 1410 1420 1430 1440 
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TTACAAAGAA AGTTCCACTA AT AGAAAAT T GGCCAAGGTC CTTTACGGTT CTTCTATGGA 
1450 1460 1470 1480 1490 1500 

TACACCATTT GCCAGCCAAG GCTAACTCTA TAAAGCAAGC TGGTTCTTCT CAGCTGGTGC 
1510 1520 1530 1540 1550 1560 

TGGTACCTAG AAGATGCCTG CTCCTCAGCT GATGCATGCC ACCATGAACA CAGATGTATG 
1570 1580 1590 1600 1610 1620 

TTTAGTTGAC ACAAAAGGCC ATTAATATCC CCACATCAGT TATCCCTGGA GGATAACTAA 
1630 1640 1650 1660 1670 1680 

GCCATCTGCC TCCATCATCT TTTAAGGGTT CAGTCAGTTT AAAACTTTGC TTCTATACCT 
1690 1700 1710 1720 1730 1740 

AGGTATTTTC TTTTCTCTGT ATGTTGGTCA GGTACAATTA TTTTTAACAG GGCTTCCATC 
1750. 1760 1770 1780 1790 1800 

AATATCATAA CTACCTAGAG AAGACATTGC AAAGATAAAA TTGGAGAATT GTTAACAGGC 
1810 1820 1830 1840 1850 I860 

TGTTAACAAA ATGTGTACCC AACTGCCAAT GAAGTGGCTT GATTTTTTTC TTTTTTTAAA 
1870 1880 1890 1900 1910 1920 

ATTTTTCTTT TGTATCCTTT TATTTTATTT ACTTATTTTT TAG AG AC AC A GTCTCGCTCT 
1930 1940 1950 1960 1970 1980 

GTTACCCAGG CTGGCGTACA ATGGCACAAT CATAGCCCAC TGCAGTCTCG ACCTCCAGGG 
1990 2000 2010 2020 2030 2040 

CCTCAAGCAA TCCTCCCACC TCAGCCTTCC AAGTAGCTGA GACTACAAGT GCATGCTGCC 
2050 2060 2070 2080 2090 2100 

ATGCCTGACT GATTTTTTGT TTTTTGCAGA GATGAAGTCT CACTATGTTG CCCAGTCTGA 
2110 2120 2130 2140 2150 2160 

CCTTGAACTC CTAGCAATAC CCTACCCTGG CCTCCCAAAC TGCTGGGATT ACAGGCATGA 
2170 2180 2190 2200 2210 2220 

GCCACTGTGC CTGGCCTTTT TTCATTTTAA CTGAGAAATG TGTTCAGCTC TTTTGTTCCT 
2230 2240 2250 2260 2270 2280 

TAGTCATTGA TCATCACTTT TGTTATATCT GTTAGTCTTG TCATAGAGTT GCTGCACTTA 
2290 2300 2310 2320 2330 2340 

TT AC AC AG AG AAGGCCTTTT ATCACGACCA ATTTATTTTA GGAAATTTCA GGGAAAACGT 
2350 2360 2370 2380 2390 2400 

TTTTCTAGAA CACCTTATTT GACATTATAA AACAACTCTT CACTCTTGCA CTCCAGACCT 
2410 2420 2430 2440 2450 2460 

CCCTTTCCAG TTTTCTTTTT CTCCATAGTG GTCATCACCA CTTGTTTTAT TTTATTGATG 
2470 2480 2490 2500 2510 2520 

GGCTGTCTGG CTCCCTCAAC TGCAAAGTAA ACTCCACAAA GGCAGAGAGT TTTGTCTCTT 
2530 2540 2550 2560 2570 2580 

TTATTCATTG CTGTACCTGC ATCACTTAGA AAGTTTCTGG CACCTAGGAA GTGTTCAGTA 
2590 2600 2610 2620 2630 2640 

AATATTTATT GAATAAGTTT ATGTAAAACG TCTCAGACTC CTTAGAGAAA CTGGTCTTT T 
2650 2660 2670 2680 2690 2700 

GGGGTTGGAG AATAAAGTTC TTTACCTCAT CAGTTAGACT CTATCTAAGG TACACGAGGG 
2710 2720 2730 2740 2750 2760 

CTTGCTAGTC TCCT AAGTT A GTCTGCTAAT AAATGTTAAC CCTAATAACT GAAATTATTA 
2770 2780 2790 2800 2810 2820 

GCAGAGGTAA TTATCCAGTT CTATATCAAG GCAAAAAGAC AGCAGTGGAT AGAAAGATCT 
2830 2840 2850 2860 2870 2860 
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fragmentl . FM02 



TAGAAGTCCC AC7AGGTTCA TCCAAGCCAC CATACACATA GGC AG AAAAA TCAAAATAAG 
.2890 2900 2910 .2920 2930 2940 

ATATGAGCCT GGACAGGGTG AGCAATCTGG GAAAAGATGA ACACAGTATG C7AGGACCCA 
2950 2960 2970 2980 2990 3000 

GAAATCATCA AGTCTATGAA AACTAAGCCA GAACACAAAT GTGAATTCCA TAAGATCAGG 
3010 3020 3030 3040 3050 3060 

AACATAATCT GTCTTGTTCA TCCAGGCATC GTAATCTGCC AGAAATAGTG CT7AACTGCA 
3070 3080 3090 3100 3110 3120 

AGAACTGAAT ATTTGTTAGA TAATTAAACC ATCAACTAAA TG AG ATTC AT GCAACCATGA 
3130 3140 3150 3160 3170 3180 

AAAATGCTGC TATAGGTACA CAATATTGAT ATACTAGAAA GTTAAAAAAT CAAGTTGGAA 
3190 3200 3210 3220 3230 3240 

ATTAGACTAT TCCATTTCTG TTTGTGTGTA TGTATCTACA AATAGGTGGA AG G AT AT AC C 
3250 3260 3270 3280 3290 3300 

AAAATGTCAA CAGCAGTTAC CTCTGGGTGG TGAGGAGTAA TCTTAACCTT GTTATTTATC 
3310 3320 3330 3340 3350 3360 

CCTATATGTT CATTTGTGAA TGAATATTTA TTACATCATT AT AAAAAGG A TT7TTAAACT 
3370 3380 3390 3400 3410 3420 

ATCTGTATGT TTAAGAGTAT ATGTTGCTAC TATGTAAGAG TATATGCTGT TACTGTAAAG 
3430 3440 3450 3460 3470 3480 

AC ATT GC ATT ACTACTGTTG ACCTCAGAGC ACGCGCCTCT TGCCTAATTC TAGGACTCCT 
3490 3500 3510 3520 3530 3540 

AACTAAGTCT TTGGAGTTTC AGCTGCAAGA ATGCTGGAGG AATACGGAAC TCCTCCCATT 
3550 3560 3570 3580 3590 3600 

TCTCACAGCC ACCTCCAACT CTTAAAAACG CTTCCAACTG CCTCCCAGCA CACAACCAAG 
3610 3620 3630 3640 36S0 3660 

GGAGAAAACT ATTCTGTCAA AGAGACGGTG CCAAAAGGCA AAAACAAAGG TAAGGATGAT 
3670 3680 3690 3700 3710 3720 

CGCTGGGGAA AGAAGCTGAA AAGGAAAAGC TCAGAACTCT AGCTGGAAAT TTCGCTCACA 
3730 3740 3750 3760 3770 3780 

TCCCTAGTAT GTTACTGCAT AGTCTGGCTT TCTTCAATCC CTCCCTTTTA AATATTAAAC 
3790 3800 3810 3820 3830 3840 

CTAGATGTAA GCAAGGTTTG CAACAAAGTC CATAAGAAAC TCAGCTTTTC TCAAAGGCAA 
3850 3860 3870 3880 3B90 3900 

GAAGAGAGCA GGATTTTTGA CTGGCTCTTT ATTCAATAGT GCTGCTTATT AAATTACCAC 
3910 3920 3930 3940 3950 3960 

TGCTACAATG TTTAAAGCCA ATTACCTGAG CACATCATAA GGATTCTCTT ACCCCTTGTC 
3970 3980 3990 4000 4010 4020 

CCAGTTAAGT AATGTTGATT GATCAACTCC TTGACAGGAG CTGATCGCAA AGAAGGTAGC 
4030 4040 4050 4060 4070 4080 

TGTGATTGGA GCTGGGGTCA GTGGCCTAAT TTCTCTGAAG TGCTGTGTGG ATGAGGGACT 
4090 4100 4110 4120 4130 4140 

TGAGCCCACT TGCTTTGAGA GAACTGAAGA TATTGGAGGA GTGTGGAGGT TCAAAGTAAG 
4150 4160 4170 4180 4190 4200 

TGAGATTTTC TTGGGTCTTG AACAGGTTGT GTTGTTATTT CAGGGTGAAT CACAGTTACT 
4210 4220 4230 4240 4250 4260 

GATGGGTCAT ATTGAGAAAT TTATTAAACA ACTCTGATCA GATTTTATTT CTATTTATTG 
4270 4280 4290 4300 4310 4320 

ATGTGGCCAT AATGGAACTG AAGTCATAGG CTGGCATCTC TCCCCCAGTC AATACTAACC 
4330 4340 4350 4360 4370 4380 

CAACCCAGGT AGCTGACCCA GGCATGTAAA AGATCTCTTC TTTTGGATTC AGCAATTGTC 
4390 4400 4410 . 4420 . 4430 4440 
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TTACAGCCCA TACTTCTGTC ATTCTTTAAT ACGCTAATAT TAGAGAACAT TTTACAAAAA 
- 4450 4460 4470 4480 4490 4500 

TAGAAGTAAC AGGGATTCTT CTCAAGATAT CACTTCTGTT TCAATTATTA AACCAAATGC 
45X0 4520 4530 4540 4550 4560 

TTCTTTAGAG ACCATGCTCT TAT C ATT ACT ATTTTTCTCT GACAAATGAA GCATGTTTGT 
4570 4580 4590 4600 4610 4620 

TTACTGAGCT TTATCAATGA CATTCTAGTA TAACTGCTGT GAAACTCTTT GTTAAATATG 
4630 4640 4650 4660 4670 4680 

TTTTATTAAA TTTATTCTAT TAATCAAACC AAAATATTGA TAATGCTATT TGTCTGTATT 
4690 4700 4710 4720 4730 4740 

AGTCCATTCT CATGCTGCTA TGAAGAAATA CTGAGACTGG GTGATTTATA AAGGAAAGAG 
4750 4760 4770 4780 4790 4800 

GTTTAATTGA CTCCCAGTTC CACAATGCTG GGGAGGACTC AGGAAATTTA CAATCATGGC 
4810 4820 4830 4840 4850 4660 

AGTGGGAAAG AGAGGTGCTG AGCAAAGGGG GAAAAGCCCC TTATAAAACC ATCAGATCTC 
4870 4880 4090 4900 4910 4920 

ATTAGAACGC ACTCACTATC ATGAGAACAG CATGAGGGTA GCTGCCCCCT TGATTCAATT 
4930 4940 49S0 4960 4970 4980 

ACCTACCCCC ACCAGGTCCT TCCCAAGACA TGTGGGGATT CTGGGAACTA CAATTCAATA 
4990 5000 5010 5020 5030 5040 

TGAGATTTGG ATGGGGACAC AAAGCTAAAC CATGTCACTG TCCTTAAAAA TTTGTATAAA 
5050 5060 5070 5080 5090 5100 

ACTTAGAAAG TTGCATAGAT AGCTATAAGG AGTT AC AATT ATTCCTTCCC ACAACCTCTC 
5110 5120 5130 5140 5150 5160 

AATAGGTAGT AGCTTACCAC CTTCTAGCTG TGAGATCTTG AGCAAGTTAT TTACATCCTG 
5170 5180 5190 5200 5210 5220 

TGTTTCAATT TACTCAGTTA TAAATGGATA TAATAACAGG AAAGTGTGAT TATCTCATAG 
5230 5240 5250 5260 5270 5280 

TGCTATTTTG AAGATTAAGG GAGATAATTC ATATAAAGAA CTTAGATAAG TTCCGGACTC 
5290 5300 5310 5320 5330 5340 

ATAGAGTTCA ATAAATGTTA GCTACTAATA ATAACTATAT ATTTT AT AG A TGAGCAAACT 
5350 5360 5370 5380 5390 5400 

GAAAGTGAGG GAGGTTAAGT GAGATCCCCA CGCCCACACA ACTGGAGGAA CTGCCCTTCA 
5410 5420 5430 5440 5450 5460 

AACCACGGCC TACGTGACTT CTAAACAGAT AAGCCCTG AC TT AC AACC AT GCCCT AACTT 
5470 5480 5490 5500 5510 5S20 

GCATTCTTGC TCAAAAAGAT TAAACAAAAG TTTAAGTTCA GAACCCAAAA GCAATGACTT 
5530 5540 5550 5560 5570 5580 

TAG AATT AT G TAATCAGGTA TCCCTGAGAT ATTAAAACAC ATAAGAATAT TCCAAATGGG 
5590 5600 5610 5620 5630 5640 

AGCAAAACGT TTGAATACAT GAAAATCAAA CTCATATCAG CAGAGACCAT ATAAAGGGCT 
5650 5660 5670 5680 5690 5700 

CTCACTGCAG GCTGACTAGT TAGGAGGATG GCAAGGTGAT CCAGGACCTG CGCATGCTTT 
5710 5720 5730 5740 5750 5760 

GTCAGTTCAA ATTGAATCTC ATGCCAACAG CGATCTTTTT TAACATGTAA CATTAGGTGT 
5770 5780 5790 5800 5810 5820 

CTCAGGTACA CATGACCATA AACCACACCT GGAGGGTTTC TTTTATTTTC TTTTTAATAT 
5830 5840 5850 5860 5870 5880 

TTTTCTGAGA CAGGGTCCTA CTCTGTCACC CAGGCTACCA TGCCCAGCCA TGGAGAGTTT 
5890 5900 5910 S920 5930 5940 

CTTAAAGATA CTGATTCCTT TGGTTAAACC TGCCACCAAN AAAAAAA 
5950 5960 5970 5980 
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ACAAAGACTG GCATTAAATA GGTAGAGACC TAGGATGCTA ATATCTTGCA ATGTGCCAAA 

10 20 30 40 50 60 

ATAATTGTCC CTGTCCCCAA CCTCACCATT GCCAATATTA CCCCTACCCC TCACAGTGAG 

70 80 90 100 110 120 

CGTCACAGGC AGGCAACAAA CTGGTGTCGT CACAGAATGA TTGATGGAAC AC AT AG ACT G 

130 140 150 160 170 180 

CATTCATTAC CTAAACATTG TCGTCACACT GCAGCAACCA AAGACAATCG CATTACCCAG 

190 200 210 220 230 240 

GGGTTAGATG TAGGAAGAGT AAAAAACAAA AAATTTTTGA ATGCGTAATT ATC AC TAATT 

250 260 270 280 290 300 

ATTTTATTTG ATCCTTCAGG AGAATGTGGA AGATGGCCGA GCAAGTATCT ATCAATCTGT 

310 320 330 340 350 360 

CGTTACCAAC ACCAGCAAAG AAATGTCCTG TTTCAGTGAC TTTCCAATGC CTGAAGATTT 

370 380 390 400 410 420 

TCCAAACTTC CTGCATAATT CTAAACTTCT GGAATATTTC AG G ATTTTTG CTAAAAAATT 

430 440 450 460 470 480 

TGATCTGCTA AAATATATTC AGTTCCAGGT ATTGTATTTT TGGGGAAATG GGTTTCTCTC 

490 500 510 520 530 540 

CATTAGTTCA GCTCATATTT AGATAGAAAA GTTACTCTGA TAATGAAAGC AATTATGAAT 

550 560 570 580 590 600 

GAAGTATCCC ATTCTAAGTA TTTGTTGAAA TATAACAGCC TCATATAAAA CCCAAAAAGT 

610 620 630 640 650 660 

AGTGTCATTA CCCTTGGTAT TATAGATTAT ATACATTAAT TGAAGAGGAA AATCATCTGT 

670 680 690 700 710 720 

TAAAATTAAA GGTTTGAATA ATAATATATT GATGTCAAAA CTTTT 
730 740 750 760 
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ccctgagaca gagtctcact ctgttgctca ggctggagtg cagtggcatg acctcagctc 
10. 20 30 40 50 60 

actgcaacct ctgccttcca ggctcaagtg attctcctgc ctcggcctcc agagtagctg 
70 80 90 100 110 120 

ggattacagg cacacatcac cacgcctggt tcatttatgt atttttggta gggacgaggt 
130 140 150 160 170 180 

ttcaccattt gggccaggct ggcctcgaac tcctgacctc aagtgatcca cccgcctcgg 
190 200 210 220 230 240 

ccccccaaag tgctgggatt acaggtgtga accaccacac ccagcctcaa aaattcattt 
250 260 270 280 290 300 

aaactaatat ctgttatcat tgaatacacc tagcttcact tgccttgaaa gggcgcatac 
310 320 330 340 350 360 

caaaattaaa ttgctgtttt getttcttag cttcttcata gaaatgggat ttcttagatg 
370 380 390 400 410 420 

tgtattaaat aaattcattg gtctctgttc atactagaag rjctgtgggaa gtatttgctt 
430 440 450 . 460 470 480 

atcatttttt tctgaatgca atctcttaca acccaaagac ggccagatca ttrtgaaaaa 
490 500 510 520 530 540 

cacttggaat tacctttccc tgtgcttcct caaaatcaac aaaaagcaat attttaatta 
550 560 570 580 590 600 

agcatgctga atttttatca atggtctata ctttgagaaa tagctactat gcttagaaaa 
610 620 630 640 650 660 

taaaatataa atcacatttc ttggccaggt atggtgatcc acgtttgtaa tcccagcact 
670 680 690 700 710 720 

ttgggaggct gaggcaggaa gatcacttga acccaagagt ctgagaccaa cctgggcaat 
730 740 750 760 770 780 

acagtgaaaa tctgtctcta caaaaaattt ttaaaagatt atccaggcac gttgataccc 
790 800 810 820 630 840 

acctgtggtc ccagctattc tagactgaga agggaggatc gcttgagcct gggaggccaa 
850 860 870 880 890 900 

agctgcaata agtggtgatt gtgccaetgc actccagccc gggcaacagt gtgagaccct 
910 920 930 940 950 960 

gtctcaaagt aaataactaa catctctgga taaacaactg ttagtgaggc ttattttcaa 
970 9 80 99 0 1000 1010 1020 

tacatgtcat tttcttagta attctaatac taggcttata taatatcaac ttacaatagt 
1030 1040 1050 1060 1070 1080 

aaattttggt gaaaatttgt atttataaat tccattaaaa tgtccagttc tacctaatgt 
1090 1100 1110 1120 1130 1140 

agtttttcac caattcctgg tagatctaac ttgtgaataa cagattatgt acaccagaag 
1150 1160 1170 1180 1190 1200 

gttttgtaac tttgcgcact taactatcaa tctacttaac aaatacattg cctttttatg 
1210 1220 1230 1240 1250 1260 

atatataact tctattccat tcttttaaag atcatgttag agtcacaagg aagtcatttc 
1270 1280 1290 1300 1310 1320 

tcttggttat tgtgttactg ctacttttgt ttcttggaga gtgaagaggg gttgggaaga 
1330 1340 1350 1360 1370 1380 

aaggtt-tctg tttatfcggtc tctgagttgg tgtaagtcat aggtgttaga gctcaactcg 
1390 1400 1410 1420 1430 1440 
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agaagcaggc 


aaactgtaac 


1450 


1460 


tgcttctcaa 


actttaacgt 


1510 


1520 


ctaacttaat 


aggtatgggg 


1570 


1580 


atactgaaga 


tcctgatcct 


1630 


1640 


taatatacta 


ctttgaacta 


1690 


1700 


atttaaagcc 


cttttacaag 


1750 


1760 


gcttaaaaat 


taccaaccca 


1810 


1820 


actaaaatac 


ttgcaaatga 


1870 


1880 


cttgacaccg 


tttcttaacc 


1930 


1940 


cagacc tcca 


gtgagctaca 


1990 


2000 


taagatcatg 


aactgtcttg 


2050 


2060 


aaaccaccat 


tcagtggaat 


2110 


2120 


aaacatcttc 


tctaatacaa 


2170 


2180 


tgccaattgc 


atgatcacct 


2230 


2240 


aaacagagag 


aagttcttta 


2290 


2300 


gaatgtacat 


gccatggtaa 


23S0 


2360 


tttaaacggg 


gaaaaaacac 


2410 


2420 


aacaagggcg 


atgccagtc t 


2470 


2480 


attcttgcgt 


aagattatga 


2530 


2540 


tcaggcacac 


atcatgagaa 


2590 


2600 


tcttaacatt 


agtgactcca 


2650 


2660 


tctctctcaa 


gtccttattc 


2710 


2720 


caggcctctt 


gcatgaagca 


2770 


2780 


aattctcaat 


gatgccttct 


2B30 


2840 


gtccagattt 


ctcatcctct 


2890 


2900 



aagccctgtt gcttatgatt gccaatgtaa tctacatcag 
1470 1480 1490 1500 

ggacatgaat cacctggata ccctgttaaa aatg^aggtt 
1530 1540 1550 1560 

taagttctga aattctgcat trctgacaag cttccaagcg 
1590 1600 1610 1620 

caaatcacat tttgaatagc aaggatctac agcacttagt 
1650 1660 1670 1680 

ccatctgaaa ccttttcttt catctgaaaa c^gcccagat 
1710 1720 1730 1740 

atttctacta auttccata tacattttta aattgagaca 
1770 1780 1790 1800 

gcagttggaa aaatatccga aaatttgaga tatacaaaag 
1B30 1840 1850 I860 

gaagcatgcc attcctctag cattataaac tttgcttcca 
1890 1900 1910 1920 

cagcagacat gaaacatcta tgcacaattt taaaaattaa 
1950 1960 1970 1980 

tttaaaaaaa tcaatgaacc aataaatcat ttta ttcaaa 
2010 2020 2030 2040 

ctcacatgat gtaccccgtt tcaaaaatag caaatgttaa 
2070 2080 2090 2100 

gctgaccatg tgtcaggcac cctgcaaagt gctttgcgtg 
2130 2140 2150 2160 

agtccacaaa gaggcggcta cataaaacgc tcctgacata 
2190 2200 2210 2220 

gaattattgg tttgtttcct tgntcagact atcaaacaac 
2250 2260 2270 2280 

aaagaaaaga tatatatttg gLgatagagc attgtaatga 
2310 2320 2330 2340 

actatttgcg tantcaggga gttaaaggaa gacaaaggtc 
2370 2380 2390 2400 

aattacataa ttgttttgaa ataattatac aaagagcaat 
2430 2440 2450 2460 

gagattggac agttactgag cagatgttct tgtagaagtc 
2490 2500 2510 2520 

tggtctttgt gtaaggtggt ggtttttgta gttxttgtta 
2550 2560 2570 2580 

cccgctcttt ctggcccttc ccaactctat ttgtcgggtt 
2610 2620 2630 2640 

tcnagattct gacagttttc atgagaactt gcttttctct 
2670 2680 2690 2700 

agtattcagc acccttaaca gattagtccc actgctgagt 
2730 2740 2750 2760 

gcaatgagaa agacacactt ggccaatgtt atcctggagt 
2790 2800 2810 2820 

ctgtgtttct tcaagacaac tgtccttagt gtgagaaaat 
2850 2660 2870 2880 

ggccaacgga aggttgtcac tcagagcaac ggcaaggagc 
2910 2920 293C 2940 
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agagtgctgt ctttgacgca gttatggttt gcagtggcca ccacattcta cctcatatcc 

2950 2960 2970 2980 2990 3000 

cactgaagtc atttccaggt gagacccgct gggattccca gctxtttgga gtaqgtttcc 

3010 3020 3030 3040 3050 3060 

aggtacttta tatgtagttt ggattgacaa gcaggattca ttgctgcaac tgggcagaac 

3070 3080 3090 3100 3110 3120 

ttggctcaat aagattgaga cagagctaga aagatgaaag acaccaaaca tcatctttgc 

3130 3140 3150 3160 3170 3180 

ttctattggc ctctgagtct tcatcacaca tagacctcag agccaacttc cttggaagtc 

3190 3200 3210 3220 3230 3240 

actaagtcct tggcataatt ttagagaatt cacatcaaac tggttctctg ttggagaggc 

3250 3260 3270 3280 3290 3300 

ccttttagcc atgtgcctgc gttggccttt ttctaccctg ccaaacaccg agcct.tt.ttc 

3310 3320 3330 3340 3350 3360 

acagggccat actcacacac aaggggagag ctcctagaaa gaaatgcttt gcaagttagt 

3370 3380 3390 3400 3410 3420 

gatggggaga gaagtgcagg aacagaaccc tgcatccagc t.gttctgg tc cacccaagtc 

3430 3440 34S0 3460 3470 3480 

tttcctcaga gaacacactt ctttcccaag gcccttagga aaatatgtaa tatagtggtt 

3490 3500 3510 3520 3530 3S40 

catagtccag gcctcacatt agaateacct ggggagcttc taaagccctg atggcctgga 

3550 3560 3570 3580 3590 3600 

gacctacccc caaagattca aacactatgg agtagggtta gagcaatgaa agtttgctca 

3610 3620 3630 . 3640 3650 3660 

ggtgatttta atatacagtc aggattaagg cctgctcatc taaagcaatt gttctcaaat 

3670 3680 3690 3700 3710 3720 

agagtcacct ggagggcttt tgaaagcaca aattgctagg ccccaccctc catatttctg 

3730 3740 3750 3760 3770 3780 

attcaacagg tgctatggct tgaatgtcct gtccaaaact catattgaga ttaatcccca 

3790 3800 3810 3820 3830 3840 

atggggcagt atgaagaggt ggggccttta agaggcgatt gagtagtaag agctctgccc 

3850 3860 3870 3880 3e90 3900 

tcaagaatgg attaagccat ttgtggataa ataggttaat ggattattgg gttacacagg 

3910 3920 3930 3940 3950 3960 

agtggaactg gtggctttat aagaagagga agagagacct gagctagcat gttagcatgc 

3970 3980 3990 4000 4010 4020 

ttggctccct caccacacaa tgccctatgc tgccttggga ctcttcagag tccaaaccag 

4030 4040 4050 4060 4070 4080 

caagaaggct ttcagcagac gcagccct.tc aaccttgact cctcagcctc cacaattgcg 

4090 4100 4110 4120 4130 4140 

tgccagaaga aataacttcc ttcccctata aaatattcgg tttcagatat tttgttaaaa 

4150 4160 4170 4180 419G 4200 

acaatagaag acaaattaag acagtagctc tggcatgagg ctgagaattt gcatttctaa 

4210 4220 4230 4240 4250 4260 

caccaggcaa tgctgatatt gctggccatg tgaccacact ttgagaacca ataatctaaa 

4270 4280 4290 4300 4310 4320 

gattctttca agcaacccca ccatcaatgg caaacacttt ataaagtcat gtgtxtccgt 

4330 4340 4350 4360 4370 4380 
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gaagxgtaaa agtagtaact 

4390 4400 

agcaagccac tgatttacac 

4450 4460 

agtttttgtt tactttttga 

4510 4520 

ataataatag cacttcataa 

4570 4580 

tttttttttt tgagatggag 

4630 4640 



agctcaccgc aacctccaca 
4690 4700 



ctcccaagta gctgggatta 
4750 4760 

tagagagagc ttcatcatgt 
4S10 4820 

cctgccttgg cctcccaaag 
4870 4880 

atgtgatatt aaagggtcaa 
4930 4940 

agaagacagt atctggtcct 
4990 5000 

actgcagccg taagctgcag 
5050 5060 

tgtttgtttt ttgttttgtt 
5110 5120 

tgcagtgact caatcagggg 
5170 5180 

acctcagtca cccgagtagc 
5230 5240 

gtattttttg tagatacagg 
5290 5300 

tcaatcaacc tgcctaggcc 
5350 S360 

cctaaacttt cttatgtgct 
5410 5420 



gaaaggaaaa gctggcaatg 
5470 5480 

tcacagactt ctctcttctt 
5530 5540 

atagccgcca atacaagcat 
5590 5600 

tgggaaactc gggctcagat 
5650 5660 

gctctctgct taccatgtac 
5710 5720 



agccatataa tcgcggctcc 
5770 5780 

catagaaaat ctggaagtca 
5830 5840 
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aggaaaggac acagaagaag cttgtctgtg attaaccacc 

4410 4420 4430 4440 

aatatggaaa ccaaccccta tgtgcctggt ttttagtttt 

4470 4480 4490 4500 

aaataagatt gctaaattgt attctaacta ttacacaatt 

4530 4540 4550 4560 



tgtgcttaag aaatatttaa gagtatctga taagtgattt 

4590 4600 4610 4620 

tctcactgtc acccagactg gagtgcagtg gcacgatctc 

4650 4660 4670 4680 

acccccatct tccaggttca agcaatcctc ctgcctcagc 

4710 4720 4730 4740 

caagtgcacg accacccctg gctaattttt gtatttttag 

4770 4780 4790 4800 

tggccaggct ggtttcaaat tcctgacctc agttgatccg 

4830 4840 4850 4860 

tgctgggatt acaggtgtga gccaccacac cttgcctaat 

4B90 4900 4910 4920 

atgtcattat atagtccaaa atagtatata ataggcaggc 

4950 4960 4970 4980 

gctgtgctca tcaccattta tttgtctctg atagagacaa 

5010 5020 5030 5040 

cctctgaaat aaaaaatcaa cccctttggt cctgtttttt 

5070 5080 5090 5100 

ttggtgttgt gacagtctca ctctgtcacc cagactggag 

5130 5140 5150 5160 

tcactgcatt ctttacttcc caagctcaag caaccttccc 

5190 5200 5210 5220 

tgggaccaca ggcatgcaca accatgccca gctaattttt 

5250 5260 5270 5280 

gtttcactat gctgctcagg ctggtctcaa actcctgggc 

5310 5320 5330 5340 

tcccaaagcg ctgggattac aggccccacc tggtctggta 

5370 5380 5390 5400 

ttactcctat agagaagagg caaaacaatt attaactcea 

5430 5440 5450 5460 

cagttttatt gaaattagct tgacatagtt gctctggagc 

5490 5500 5510 5520 

ccccctgaag gtatggagag gttcaaaggc caatatttcc 

5550 5560 5570 5580 

ccagatggat ctgagggaaa acgcatcctg gtgattggaa 

5610 5620 5630 5640 

attgctgttg agccgagtaa gaatgctgct caggtgtgat 

S670 5680 5690 5700 

ctggagggga ggaagtgggg atgccatact ggagaacccc 

5730 5740 5750 5760 

aatcctcatt aactagttgg ttggtagcgc attgtggcac 

5790 5800 5810 5820 

agaaaccact ttacctccta gctctgtcac taaccagcca 

5650 5860 5870 5680 
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tgaatcctag agtgattcat ttcacttcrc tgggagatgg ctccctcatt tctaaaatgg 
5890 5900 5910 5920 5930 5940 

gaacttttga ccagatgatt ttccacataa gaggcctttc atcaacatgg ctcactgcag 
5950 5960 5970 5900 5990 6000 

ccttgacctc ctgggctcca atcttcctgt catctcagcc tcctgagcag ctgggactac 
6010 6020 6030 6040 6050 6060 

aggcacatgc cacaccacac tcagccaatt ttcatatatt tgtagagatg agggtcttgc 
6070 6080 6090 6100 6110 6120 

cacgttgccc agggtagtct aaaactcctg aactcaagca atctgcccgc ctcagcctcc 
6130 6140 6150 6160 6170 6130 

caaagtgccg ggattacagg catgcacaac cacacccagc caagaggcct tgtttctacc 
6190 6200 6210 6220 6230 6240 

tggatgttta atgagnnagg tncaatctgt tcacattctg gagggtggct tttagaaatt 
6250 6260 6270 6280 6290 6300 

tagtgtgtat tcgaattata tttgaaanat agataacctt cagttaccca aatattatga 
6310 6320 6330 6340 6350 6360 

aaagaaagat taaatagata gtaggtctct caactaaaat catagatatc. taggtgcntc 
6370 6380 6390 6400 6410 6420 

ctgaggcctt cnaaccactg tcttctttgc acctgctcag gaatgacacc agctgagctg 
6430 6440 6450 6460 6470 6480 

ccaaagagtc aaacattcat tacatgatga tgctgctgac agtggtggtc aggaacagca 
6490 6500 6510 6520 6530 6540 

aaaactaaac tccttctgca aggacagacc taggcaaaga agggaaaatc accaaacatc 
6550 6560 6570 6580 6590 6600 

ctttcccaaa gtattccccc tcaagaaggc ctgaaccaga tgcccaacca cccctaccct 
6610 6620 6630 6640 6650 6660 

agctctttca gcctgacgtc tctggccacc cagggcttac cacggccctg tgcacaacca 
6670 6680 6690 6700 6710 6720 

acaaaccatt tccatcccaa gccttacact ttcaggactc tagataccca gtggcaaaag 
6730 6740 6750 6760 6770 6780 

ctacaagcaa acacgacacc cgcccagcag gttaatgaag gggtcatacc gggacctgtc 
6790 6800 6810 6B20 6830 6840 

agagtcatct atcagccagt tagttagtgc cagcccggga acagagcagg tcaccaacac 
6850 6860 6870 6880 6690 6900 

cggaaagaga cttactagac ccaacaagtc ttcactttgt gaaaacaaac cccttgtcac 
6910 6920 6930 6940 6950 6960 

ctaccacctc agtgtgaaga acaagtgagg aggcaggaac tgtgacagcc tggagaagag 
6970 6980 6990 7000 7010 7020 

cagagctgga aaatgagagt accagctcta ggctctttca cgctacgaat acccgcaaag 
7030 7040 70S0 7060 7070 7080 

ccttaggaac agagtataat ggggcagtat gtgaggagct aatatagcag tcagccaagt 
7090 7100 7110 7120 7130 7140 

gaagatccat cctagactac ttcacgttgt cagaccagtg atttggatct agatctcttc 
7150 7160 7170 7180 7190 7200 

attccaaaga tatcaaatct tagatggcaa gaaccagttc cttgtatggg tcttgcccta 
7210 7220 7230 7240 7250 7260 

caggaagact tatggtgtga gactcaatat taagaaacta cctcggctct attngcatgc 
7270 7280 7290 7300 7310 7320 

cttacagctt cttaaacaat cttttgcaca gagtgcaaaa gactttgttt ccacctccct 
7330 7340 7350 7360 7370 7380 
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ctatcagtgt aaatgccact agatgccccc tttttaggag gtactccact ttgaggtcaa 
7390 7400 ' 7410 7420 7430 7440 

tcatctttaa aacagagcct cagtaaattc tggggctatg catgtgatac atcacctaca 
7450 7460 7470 7480 7490 7500 

taatagattc ctcctaaaca taatgtxata accatacatt. tccaggatta uctcattca 
7510 7520 7530 7540 7550 7560 



cctgcactaa tctcttcaat atttattaga guacaacat aaatctataa ctatgataaa 
7570 7580 7590 7600 7610 7620 



acctcttaca cagagtaata tactctcaag ccttctgtga aaagactaac cagagacttt 

7630 7640 7650 7660 7670 7680 

acaggagcta tacatgctag gaacggaact aggcgcatct gcaaaacttg aaatcacaac 

7690 7700 7710 7720 7730 7740 

ctgaactcac caaaattccg agtgtgcact gctctgttaa aagaaattca ccctcataag 

7750 7760 7770 7780 7790 7800 



gttacagcac cctctaccac aatccaaaag caccactcaa gatcatatgg gatggtgctg 
7810 7820 7830 7840 7850 7860 



catcattgta ttagtccatt ctcaacgctg ctatgtagac atacccgaga ccgggtaatt 
7870 7880 7890 7900 7910 7920 



cataaagaaa agaggtttaa ttgacttaca gtttggcatg gctggggaag cctcaggaaa 
7930 7940 7950 7960 7970 7980 

ccaacaatca tgacggaatg cacctcttta cgaggctgca ggagaaagaa tgagagcgac 
7990 8000 8010 8020 8030 8040 

tggggaaccc cttataaaac catcagatct cgtgagaact taccccctat taggagaaca 
8050 6060 8070 8060 8090 8100 

gcatggcaga aacccccccc atgatcgaat catccccacc tggtcccgcc cccgacacgc 
8110 8120 8130 8140 8150 8160 



ggggattatt acaatttaag gtgagatgtg ggcagggaca cacagccaaa ccatattagt 
8170 8180 8190 8200 8210 8220 



cacttacata cctctgacca aaaaccaaat ctctggcctt tgacccaaaa cacgcgtctc 
8230 8240 8250 8260 8270 8280 



agagaaagca gcctgagcct aaatcctcat gcctctccca ccgttgcagc tagtgtcatt 
8290 8300 8310 8320 8330 8340 



aaggcaggct agaccacccc gctgtaggga gggtcacaac agaaaaagag tgaatcaaac 
8350 8360 8370 8380 8390 8400 



gggcagagca taccatttga aacatggttt gctcctgaga aagaagaggg gacagtaagt 
8410 8420 8430 8440 8450 8460 



aacggaaaga gacactaatg aaaatatttt tgtatctaat atctaaccaa agtattgcca 
8470 8480 8490 8500 8510 8520 



agtcagccta taagggcaac ggcaggagaa attcagaaca taggtatata ccacacacag 

8530 8540 8550 8560 8570 8580 

accagcaata taggaatgct tggtataggt gctacttcac aagccaggaa tgtaaggccc 

8590 8600 8610 8620 8630 8640 



atccccacaa aattcgtctc caaattetgg tttaccccag acataaggca ctgtatgaaa 
8650 8660 8670 8680 8690 8700 

ctcctctctt ccagcctaac tttataactt aacagetagc agtacttatc acttgccagg 
8710 8720 8730 8740 8750 8760 

caatatttca agtactttat atataccacc tcattcaatc cacacaagaa tgccatgagg 
8770 8780 8790 8800 8810 8320 
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taggtactgt taataccccc attttacaga gagagaaact gaggcacaga gagatcgaaa 
S830 8840 8850 B860 8870 6880 

taattcaacc atggcaacac agattgaaat agttcaccca cagcagcgtg atcgggattc 
8890 8900 6910 8920 89 30 894 0 

aaacccaagc agtctgtatc caaacctctc aagtaaattg gttaccttgc aagtgaatct 
8950 8960 8970 8980 8990 9000 

tatgtgttta tcaagtatag ccttaaacaa aaacttattg catggtatgt aaaaatttaa 
9010 9020 9030 9040 9050 9060 

gaagcagttic aagtatgcat ttggccaatg ggggagtaac agcaaacaca gcaaaatata 
9070 9080 9090 9100 9110 9120 

catttgaaaa gagattaaat gtacattttg gaaacaaggg aaatcttaat aaacaaggta 
9130 914Q 915Q 916Q 9170 9180 



aagaatacac ctgaaagagg attcagatgt gcacttgaag agaaagagaa tcacagcata 
9190 9200 9210 9220 9230 9240 

agttcagagt ttttaacttt taaaatacac tacaagcact gtytctcatg cccgtaaccc 
9250 9260 9270 9280 9290 9300 

cagcacrrtg ggaggctgcg gcaggaggac tgcttaagcc cagaaatttg agaccgacct 
9310 9320 9330 9340 9350 9360 

gggcaacaca atgagaccgt ctctacaaaa aaactgtttg aactagctgg acgtggcggc 
9370 9380 9390 9400 9410 9420 

acatgtctga tactgaggtg ggaggaccac ttgagcctgg gaggccgaga ctgcaatgag 
9430 9440 9450 9460 9470 9480 

ctatgactgc acaactgcag tccagcctga gcgacagagc aagaccctgt ctcacacaca 
9490 9500 9510 9520 9530 9540 

cacacacaca cacacacaca cacacacaca aaataaagcc ttttaagtat ggaaggaaga 
9550 9560 9570 9S80 9590 9600 

ttatttcccc tgttactctc catccaggga tattcagatg catacacact tatacttgtg 
9610 9620 9630 9640 9650 9660 

tagccactag gctataatcg cacacttcca aggattataa tcattctacc tgcactatag 
9 670 9680 9 690 9700 9710 9720 



aagaaact.ta ggtgagtgga aaacatgaga ggagggaggg aggaaccttc tctcaaggag 
9730 974 0 9750 9760 9770 97 80 

cagcaaacca caactgtaaa catgggaaag acttgtggac ttcaccatca gagctagccc 
9790 9800 9810 9820 9830 9840 

aaagacttrc tcgtgtctcc atgaagttct caagattttg ttgcagtctt cctgcatcag 
9850 9860 9870 9880 9890 9900 

tgtaaatgcc actgggtacc cctatttagg aggtacttta cattgaggtc aatcatcttt 
9910 9920 9930 9940 9950 9960 

aaaacaoaac ctctgtaaat tctggggcta cacatgtgat acatgacctt cacagtagat 
9970 9980 9990 10000 10010 10020 

tcctcctaaa cgggacaatg ccctaattta aactgcattt ctLttcgctt gccaggtttt 
10030 10040 10050 10060 10070 10080 

taccagcacc aggcatggca cctgggtcat gagccgtacc cctgaagatg gctatccttg 
10090 10100 10110 10120 10130 10140 

ggactcagtg ttccacaccc ggtttcgttc tatgctccgc aacgtactgc cacgaacagc 
10150 10160 10170 10180 10190 10200 

tgtaaaatgg atgatagaac aacagatgaa tcggtggrtc aaccatgaaa attatggcct 
10210 10220 10230 10240 10250 10260 
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tgagcctcaa aacaagtaga gttattttgc ttttttaatg gtatactcgt tggtgagcaa 

10270 10280 10290 10300 10310 10320 

agttgtctga aggtgtctcc cttaacaaag attcaaattg ctaacacggt agttaaaact 

10330 10340 10350 10360 10370 10380 

acaacctaac aatatgagta tcttataggt cctggagttt agcttctaaa txtggactiga 

10390 10400 10410 10420 10430 10440 

acccctttaa aaaatacgta agaagatgaa gcagaagtgt tataagctgc tccagaaagc 

10450 10460 10470 10480 10490 10500 

aaaaccaggg gagaactttc taatacccag agttatctaa cattggagaa aactgtttca 

10510 10520 10530 10540 10550 10560 

agagattacg acctgccttt cagaggggtg tggcgggaaa catgtaattc tccatctaat 

10570 10580 10590 10600 10610 10620 

aatttatgct ttgctaaccc tatagcatga aggttcttcc catgggaaac ccttgaaaac 

10630 10640 10650 10660 10670 10680 

acattccttt ttctttgcta aaagacaaat ctctgttgan cgtcaaagtt atatgtcagt 

10690 10700 10710 10720 10730 10740 

gatttaagca caagcaaatg ttatgaatgg ttcttttgct ttagttgtta caggcttctt 

10750 10760 10770 10780 10790 10800 

cccttaaaaa aacagaagag ctttagaatc ttttaacaaa cgcctgccgt gcaactacca 

10810 10820 10830 10840 10850 10860 

tattctaaga tccgacataa gtgccacgca tcgtctatta aaaaaagaaa aagaaaatgt 

10870 10880 10890 10900. 10910 _ 10920 

tctcaaatct acaaaaaaaa taagcggact ttgcatcaac atccatgcta ttactaacag 

10930 10940 10950 10960 10970 10980 

agactccatg gatatttggg attaacaaat atcaccaaac ctaattttac acattaattt 

10990 11000 11010 11020 11030 11040 

tcacattgat cccttcatag atttcaaaac cagtggaaat ttagcaaatt ttttcttatg 

11050 11060 11070 11080 11090 11100 

atcaaatagg ggttaaataa aacagcaaaa taataaaagc tagatagcat. gaaaaaggtc 

11110 11120 11130 11140 . 11150 11160 

aaaaacagaa atggcanaat aaccaccata acacttgggg attgaccata ggcacaggca 

11170 11180 11190 11200 11210 11220 

ttttgtctaa gcccntgggg atgcttccct ccttaaaatc tctttcactc acgttgccca 

11230 11240 11250 11260 11270 11280 

cacgttctcc cctatttatt gacaagagat atttgtgaca tgagaattaa gtcagaaaat 

11290 11300 11310 11320 11330 11340 

aaggacttgc acagacaacc agttaagtta gagttttaca gacatttgaa aagccccttt 

11350 11360 11370 11380 11390 11400 

atcttcagag ccgtacccca aaaatatcaa gagggttcaa gattcctcag caaatgatcc 

11410 11420 11430 11440 11450 11460 

ttcagaatgt ttttcttctg tatgtctcag atacattatg aaggaacctg tactaaatga 

11470 11480 11490 11500 11510 11520 

tgatgtccca agtcgtctac tctgtggagc catcaaggtg aaatctacag tgaaagagct 

11530 11540 11550 11560 11570 11580 

cacagaaact tctgccatct ttgaggatgg aacagtggag gagaacattg atgtcatcat 

11590 11600 11610 11620 11630 11640 

ctttgcaaca ggatatagtt tctcttttcc cttccttgaa gattcactcg ttaaagtaga 

11650 11660 11670 11680 11690 11700 

gaataatatg gtctcactgt ataaatacat atcccccgct cacctggaca agtcaaccct 

11710 11720 11730 11740 11750 11760 
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cgcgtgcatt 
11770 

tcgtcgggtg 
11830 

cagatctggt 
11890 

agaaaaagtt 
11950 

gaattcaaag 
12010 

taaaatatta 
12070 

cctttgaatc 
12130 

ctgtttaaaa 
12190 

caacctcaca 
12250 

gtagcacttc 
12310 

cagcaaaagc 
12370 

taaacagatc 
12430 

cagggaagga 
12490 

aaaacgtcct 
12550 

atagagtcaa 
12610 

atqaggcaga 
12670 

ttttaagaca 
12730 

ctacatatga 
12790 

ggacctggaa 
12850 

gcaaggaaca 
12910 

atatagattt 
12970 

atagcctatg 
13030 

agccataaat 
13090 

gtgggaaagt 
13150 
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ggrctcatcc agcccctagg ttccattttc 
11780 11790 11800 



acaagagttt tcaaaggcaa gtgtgcaggc 

11840 11850 11860 

gaagtttatc aataatgata agaaggttgc 

11900 11910 11920 

tgacaacctt ggccgctctc acaagaccaa 

11960 11970 11980 

aataacaaat acaggaattt agtaataata 

12020 12030 12040 



gacagccaag agaatttcaa ctggcacaaa 
12080 12090 12100 

gcgagagata agtttaagaa aaagatctgt 
12140 12150 12160 

attcctcagc atatctgcaa atcaatttaa 
12200 12210 12220 

aatecctaca agctataaaa ttattaaaag 
12260 12270 12280 

acactcctca gaacggtgtt acctccctgc 
12320 12330 12340 

tcactgaata ccttgcectg tgctgggaac 
12380 12390 12400 

atttcaacat aacangacaa atgctttgat 
12440 12450 12460 

gagaaagggc acttatcatg gtagaataag 
12500 12510 12520 

ggataactgc atttctcagg ggcagaaaag 
12560 12570 12580 

cgacgcatac ggaagggcac atgctatttg 
12620 12630 12640 

gagagatgag ccactactct tggagaagaa 
12680 12690 12700 

tgctatiggag cttagattat aaattataga 
12740 12750 12760 

aaatcacctg atggatcctt agggaccctg 
12800 12810 12820 

tctgcatttt agaaagctct tcagcccggg 
12850 12870 12880 

ggcattagca gatttacact tcagatagat 
12920 12930 12940 

gaaagtgggg aaagaccaca gcctcaggga 
12980 12990 13000 



ctaaaatatg atgcatcctg ggccagggca 
13040 13050 13060 

gtgagaaatc attaagggaa aaatcagcat 
13100 13110 13120 

cagagaaata gagaggaatc taggaggact 
13160 13170 13180 
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ccaaccgctg aaccccaagc 
11810 11820 

aggtgagcgg ccaagcgctt 
11870 11880 

ctgagataaa aaggttgcca 
11930 11940 

cattctaaaa agctactgga 
11990 12000 

aatacccgca atcatccttt 
12050 12060 

gccaagtgca tgttaacctt 
12110 12120 

cccctggttt tacctctgtg 
12170 12180 

c:cttaatac ttgagcagct 
12230 12240 

gttcctttct gggtgtctgt 
12290 12300 

ctccagggtc caattctgtt 
12350 12360 

tggtgggaca gagagaaatt 
12410 12420 

tgaataacac atggagtgtt 
12470 12480 

ggaagggcac atgataaagg 
12530 12540 

gggattgccc gaacaaaagc 
12590 12600 

acattgccag agcatgacgc 
12650 12660 

ggagacagga cacaqgaacc 
12710 12720 

tcagttcttc ccaaatatgg 
12770 12780 

attaagtaag actggccaag 
12830 12840 

gcaccaatga agggtcataa 
12890 12900 

tgcttcagca gtagtgtgga 
12950 12960 

tgaaagagaa agccaccgaa 
13010 13020 

gagacacaaa gtggaaagga 
13070 13080 

gacattatga ttggttcaat 
13130 13140 

tacagatctc tggcattgga 
13190 13200 
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aaccaggtgg acagtagtqc tgtgaataca gagggggtgt gcagaaaatg atgcaagtct 
13210 13220 13230 13240 13250 132S0 

ggacaggagg gcttcagtga ggagctcagg tctggactac ttgaacacga gatgtctgat 
13270 13280 13290 13300 13310 13320 

gactctaggc aaggggactt gaccatattt caacacatcc aaagctcagg ggacacttgc 
13330 13340 13350 13360 13370 13380 

gggcaggcga tggagtcatg agcacacagt aataacttct gcatcaatct ttccctatct 
13390 13400 13410 13420 13430 13440 

ctactgccct actctcatct ctcaccaggt ttatttcaac agcctcttta ctggtctccc 
13450 13460 13470 13480 13490 13500 

cagctttggg cttgcctccc tggagtccat tttcctaaat tcagcagcca gacagatctt 
13510 13520 13530 13540 13550 13560 

tccaaaaaat aaatctgatc ttctcacttc attcagaata ctcttccact gatttgattt 
13570 13580 13590 13600 13610 13620 

ggggcctcct gtcaccttca ggatagagcc caaaccacta gtcatggctg ccaggctccc 
13630 13640 13650 13660 13670 13680 

agacacactt cccr.Ltc.cca gcctcttctc ttggccct.cc ccacttgtag tccatgccgt 
13690 13700 13710 13720 13730 13740 

agactgtgca ccccggacag cgtcacatag agtgctatgg gggtggcacc ccctgaagtt 
13750 13760 13770 13780 13790 13800 

caacagcacg gaagccctga ctggtacgac atggttcaat gcccagagtt taattttaag 
13810 13820 13830 13840 13850 13860 

aatcaacaac tagacaaagt aatgatattg actcaaactt actattcaaa ccaacctttt 
13870 13880 13890 13900 13910 13920 

actccttagg cttgtgtagc ctgccctcag agagaactat gatgatggac actatcaaaa 
13930 13940 13950 13960 13970 13980 

ggaatgaaaa aagaattgac ctgtaagaat tttttttaat tctttacacg aagcagcgtt 
13990 14000 14010 14020 14030 14040 

tctcaaagta cagtgatcta accacttaca agaaccacct agctgcctga taaaatgcaa 
14050 14060 14070 14080 14090 14100 

acttctgggc tatagcccag atgattgaat cagaaacccc gtgtgtgagg ccaaaaagtc 
14110 14120 14130 14140 14150 14160 

gcatttttat cttcttccta agcgattctt atacatacta ggttaagaac caaatactta 
14170 14180 14190 14200 14210 14220 

aagataagaa ttgtaccaaa tcagagcact tctccttggc ttaatctcat ttcagtttta 
14230 14240 14250 14260 14270 14280 

tatgatgcct atgtcagatt ccataacttc tcaagccacc tacactctgt ggttagagag 
14290 14300 14310 14320 14330 14340 

ggaatgggat gagacagcgg tggtgatagt ogctcgaata gctgtgaaaa gttagagaat 
14350 14360 14370 143B0 14390 14400 

ccccatcaga ataaattagg aaggggttgg tgtgaaggtt caaggatttg tactttgtga 
14410 14420 14430 14440 14450 14460 

tgaggtaaaa tgaggttcaa cagtgatcga gcacccttgg aaagttgatt tggggcttac 
14470 14480 14490 14500 14510 14520 

accaggtgta aagagttttc tcatgttcaa attcaaattt acctaagatt gattgagtat 
14530 14540 14550 14560 14570 14580 

ctactatacg ccatccagac tgccaggtac tttagtaatt taacaagcaa atattaagca 
14590 14600 14610 14620 14630 14640 
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tctcctttga gcaagacacc aagctatgct ttcatatgca ttatctcatg aattcctgca 
- 14650 14660 14670 146B0 14690 14700 

gccgccctgg ctagcatgta cttgcctgga gatttgccac cgcttaaaaa atgccaaaca 
14710 14720 14730 14740 14750 14760 

atggttacca atcttgtcac atttctagag catccatgaa ttcatggctc tttatttgag 
14770 14780 14790 14800 14810 14820 

ggcgtattct caatctgaga tatgagcctc ctggtatgat aaactcaaac tttccaccag 
14830 14840 14850 14860 14870 148B0 

agattcattg aaaactcatt cacatattca ctcattcctt cattccttta gcagtttcga 
14890 14900 14910 14920 14930 14940 

atgcctaaca ttctagaaaa cttagaacat tctgtgaaca ttcccttttc actttcttca 
14950 14960 14970 14980 14990 15000 

ctaaggtttg gagaaagcca gagccagacg ttgcagacca attatgttga ctacttggac 
15010 15020 15030 15040 15050 15060 

gagctcgccc tagagatagg tgcgaagcca gatttctgct ctctcttgtt caaagatcct 
15070 15080 15090 15100 15110 1S120 

aaactggctg tgagactcta tttcggaccc tgcaactcct attagtatcg cctggttggg 
1S130 15140 1S150 15160 15170 15180 

cctgggcaat gggaaggatt cagaaatgcc atcttcaccc agaagcaaag aatactgaag 
15190 15200 15210 15220 15230 15240 

ccactcaaga cccgggccct gaaggattca tccaatttct cagtttcctt tctgttgaaa 
15250 15260 15270 15280 15290 15300 

atcctgggcc ttcttgctgt tgttgtggcc ttcttttgcc aacttcaatg gtcctagtca 
15310 15320 1S330 15340 153S0 15360 

gcataatgct ttgggcttta ttatcttgtc agtcactacc tcctaaagaa aaaaaaaaag 
15370 15380 15390 15400 15410 15420 

gctagaagaa aaaacattac attcatgttc taattataga ttttagagtt aggtagtaca 
15430 15440 15450 15460 15470 154B0 

ggtaaggggg aaattgtaaa gaattagcag aactaggcat atgcacaaaa ccaaaacttt 
15490 15500 1S510 15520 15530 15540 

gtcatgaaat trtgcct ttc cacgcttccc tcagttcacc aaagttacca aaatgtaaaa 
15550 15560 15570 155B0 15590 15600 

taaaataaga ccggctcagg taagtagtgc tgccaaccct gatacagggg agttgtatgg 
15610 15620 15630 15640 15650 15660 

aaaaatagta gaattacaca gcatgaaaag cagcccatgg tctaaattat tggacaattt 
15670 15680 15690 15700 15710 15720 

aaattgtggg taaatattta aaactcctga acaatgtttc tgatggtctt ctatccaccc 
15730 15740 15750 15760 15770 15780 

tacttggtaa caaagttctc agatgttagg tcatgtttca tttgctcagt cggggatcac 
15790 15800 15810 15820 15830 15840 

tcaaaactac tagacaaaaa agtgagagga tagatttaga aaacatcagt gatgctcaga 
15B50 15860 15870 15880 15890 15900 

taaactttta ggacctcata ttaagagcta agcaaatggc cacatttcct atattttgac 
15910 15920 15930 15940 15950 15960 

agagatactg ccggaaaaat taaaactaaa atgccataat agctacctaa caaacatata 

15970 15980 15990 16000 16010 16020 



tgttxaatgt ttatcatagg 
16030 16040 



ccagacattg tgctatgtgc 
16050 16060 



atatcacatg tattatttca 
16070 16080 



tttaattctc acaacaattc 
16090 16100 



tgtgaaatgg taacagctat 
16110 16120 



tatagtcatt tcacagatga 
16130 16140 
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f ra'gment3 . FM02 

tgaaactaag at:cagagca gctgatcttg tgaggcagct ggaattggaa ctcagatctg 
16150 16160 16170 16180 16190 16200 

ctgaactcta gaactaaaga tcataatgtt gtcttgtaat atatttattt acaaaacact 
16210 16220 16230 16240 16250 16260 

tcattattta taaagaattt actaacagct tatcttactt atacccatac atctgctacc 
16270 16280 16290 16300 16310 16320 

ttgggaggcc ctttacatag aaaacagcat tctttttgct aaatatgacc aaattacttt 
16330 16340 16350 16360 16370 16380 

tatttataat ttttgattta tatttcagct agatctaaaa agcatctgaa ggaatttaca 
16390 16400 16410 16420 16430 16440 

atgaaagata cctatgcaat aacatttagg acaatccttg acatttcgga aaaataagaa 
16450 16460 16470 16480 16490 16500 

ttgaggaaaa aaagtgtatc tttcaagtag atgcaaagca ttataatgat tgacacttgt 
16510 16520 16530 16540 16550 16560 

atctaactcc agtcttacag ataactaagg caaaaagcta aataaacaat atgtaacctc 
16570 16580 16590 16600 16610 16620 

taacatttgg taaaaggaag tataccggtc tgtcagcaga gacaaactcc ttttagaatt 
16630 16640 16650 16660 16670 166B0 

gaagtctgaa acaaacaaaa gcaattcaac gtcaatagac actaagcaac ataatagaca 
16690 16700 16710 16720 16730 16740 

aacatctcct aagggaacat ttgttacagc tgctccttcc ctgaactgcg ctttggaaga 
16750 16760 16770 16780 16790 16800 

taagctctgt cctgagtcca aaccaagccc tcccaagaga gaacaaaggt cagagatgtt 
16810 16820 16830 16840 16850 16860 

gaagattcca gcaaatttct cctcttattt ctaccaagcc tttgtgaaca ttgctcttca 
16870 16880 16890 16900 16910 16920 

tcttggcctg tacttctccc tcagggacgt agaacaatgg aatgtcagcc agtctctgta 
16930 16940 16950 16960 16970 16980 

gctaaaactt tttctttaaa attcaattaa gctacttctc cctcagggac gtagaacaat 
16990 17000 17010 17020 17030 17040 

ggaatgtcag tcagtctctg cagttaaaac tttctcttta aaattcaatt aagttacacc 
17050 17060 17070 17080 17090 17100 

agaatttaca ggcaagattt tttxtttcat tgctcccata agcaaatttg ttttaaaata 
17110 17120 17130 17140 17150 17160 

attgtaaatg aggtatatac ttagttcttg gttaaaaaat atattgcttt gttaagtatt 
17170 17180 17190 17200 17210 17220 

aaagattatt tgtaagtcat tgtattaata atactaataa aatttatcaa gcctttatag 
17230 17240 17250 17260 17270 17280 

caagggtcag tgaatcacca ctgcctgtgg gccaaaccta gctcactatc tgtttttgca 
17290 17300 17310 17320 17330 17340 

aataaaatrt tataatagta cacagccaca ctcattcatt tattttctgt ggctgctttc 
17350 17360 17370 17380 17390 17400 

aagctacaac tgtagagttg ggtagtcgca acagaatctc tgtggcccac aaggctaaaa 
17410 17420 17430 17440 17450 17460 

tatttacatt ctcacccatt acagaaaaag tttgataatt cctgctttat aatatgtaag 
17470 17480 17490 17500 17510 17520 

gcattgtccc attttgcata acttgcctta tttcatcatt atcactaccc atttagtagc 
17530 17540 17550 17560 17570 17580 

tatggctgtt atcttacttc tacagtggaa gagattgaaa agcatttgtc aggttaatgc 
17590 17600 17610 17620 17630 17640 

taaatcagcg cggaaatata gctc 
17650 17660 
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FIGURE 3A 

FM02 position sur le gene position sur le mRNA 
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FIGURE 3B 

FMOx position sur le gene position sur le mRNA 
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homologie FM02 



Longueur 



% homologie Macaque /homme 
Acides Amines 



% homologie Macaque/homme 
ADN 



exon 1 
(5*UTR) 

exon 2 

exon 3 

exon 4 

exon 5 

exon 6 

exon 7 

exon 8 

exon 9 
(3' UTR) 
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Tableau FM02 



Variation homme/macaque sur FH02 



position mRNA macaque | base macaque | base humain | amino acid 



56 
71 
83 
104 
197 
218 
266 
284 
344 
360 
404 
455 
482 
499 
510 
548 
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629 
650 
676 
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729 
743 
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811 
844 
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1085 
1121 
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1251 
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1448 
1450 
1473 
1484 
1486 
1509 
1S10 
1514 
1516 
1535 
1541 
1556 
1567 
1590 
1598 
1623 
1646 
1677 
1678 
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non codant 



Lys -> Asn 



Ser -> Thr 
lie -> Phe 
lie -> Met 
Ser -> Phe 



Asn -> Ser 
val -> lie 



Val -> Ala 
Arg -> Gin 



Glu -> Asp 
Phe -> Leu 



Ser -> His 
Ser -> Kis 



Tyr -> Phe 
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Alignemen t -mRNAFM02 



Macaque4 53 |MMU59453 Macaca mulatta flavin-containing mo 6431 6431 6479 
96.7% identity in 1721 nt overlap 



10 20 30 40 50 60 

mRNApo t AACC AAGGG AGAAAACT ATTCTGTC AAAG AG ACGGTGCC AAAAGGC AAAAAC AAAGGAGC 

Macaque GGCACGAGGAAAACTATTCTGTC-AAGAGACGGTGCC AAAAGGC AAAAAC AAAGGAAC 
10 20 30 40 50 

70 80 90 100 110 120 

mRNApo t TGATGGCAAAGAAGGTAGCTGTGATTGGAGCTGGGGTCAGTGGCCTAATTTCTCTGAAGT 
*••••■»•■•■•• ...•«.••...»•••«»•». »•••««•••»••. 

Macaque TGATGGCAnAGAAAGTAGCTGTGATCGGAGCTGGGGTCAGTGGCCTGATTTCTCTGAAGT 
60 70 80 90 100 110 

130 140 150 160 170 180 

mRNApo t GCTGTGTGGATGAGGGACTTGAGCCCACTTGCTTTGAGAGAACTGAAGATATTGGAGGAG 

Macaque GCTGTGTGGATGAGGGACTTGAGCCCACTTGCTTTGAGAGAACTGAAGATATTGGAGGAG 
120 130 140 150 160 170 

190 200 210 220 230 240 

mRNApo t TGTGGAGGTTCAAAGAGAATGTGGAAGATGGCCGAGCAAGTATCTATC AATCTGTCGTTA 

,««...».••••••#•••.»• 

«■«•••••■■••«••*■•• .,..»••••••••*••»••• •■••*••«••*•••*••«« 

Macaque TGTGGAGGTTCAAAG AG AAGGTGGAAGATGGCCGAGCAAGCATCTATC AATCTGTCGTTA 

180 190 200 210 220 230 

250 260 270 280 290 300 

mRNApo t CCAACACCAGCAAAGAAATGTCCTGTTTCAGTGACTTTCCAATGCCTG AAGATTTTCCAA 

Macaque CCAACACCAGCAAAGAAATGTCCTGTTTTAGTGACTTTCCAATGCCCGAAGATTTTCCAA 
240 250 260 270 280 290 

310 320 330 340 350 360 

mRNApo t ACTTCCTGCATAATTCTAAACTTCTGGAATATTTCAGGATTTTTGCTAAAAAATTTGATC 

Macaque ACTTCCTGCATAATTCTAAACTTCTGGAATATTTCAGGATTTTTGCCAAAAAATTTGATC 
300 310 320 330 340 350 

370 380 390 400 410 420 

mRNApo t TGCTAAAATATATTCAGTTCCAGAC AACTCTCCTTAGTGTGAG AAAATGTCCAGATTTCT 

Macaque TGTTAAAATATATTCAGTTCCAGACAACTGTCCTTAGTGTGAGAAAGTGTCCAGATTTCT 
360 370 380 390 400 410 

430 440 450 460 470 480 

mRNApo t CATCCTCTGGCCAATGGAAGGTTGTCACTCAGAGCAACGGCAAGGAGCAGAGTGCTGTCT 

Macaque CATCCTCTGGCCAATGGAAGGTTGTCACTCAGAGCAATGGCAAGGAGCAGAGTGCTGTCT 
420 430 440 450 460 470 

490 500 510 520 530 540 

mRNApo t TTG ACGCAGTTATGGTTTGCAGTGGCCACCACATTCTACCTC ATATCCCACTGAAGTCAT 

* Z Z • St5J2!*SI!S*t*!3 tSJtJSSSJJ 

Macaque TTGATGCAGTTATGGTTTGCACTGGC C AC CACTTTCTACCTC ATATCCCACTGAAGTCAT 
480 490 500 510 520 530 
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Align ement -mRNAFM02 



550 560 570 580 590 600 

mRNApo C TTCCAGGTATGGAGAGGTTC AAAGGCC AATATTTCCATAGCCGCCAATAC AAGC ATCCAG 

Macaque TTCCAGGTATCGAGAGGTTCAAAGGCCAATATTTCCATAGCCGCCAATACAAGCATCCAG 
540 550 560 570 580 590 

610 620 630 640 650 660 

mRNApo t ATGGATCTG AGGG AAAACGC ATCCTGGTG ATTGGAATGGG AAACTCGGGCTC AG ATATTG 

Macaqu e ATGGATTTGAGGG AAAACGC ATCCTGGTGATCGGAATGGG AAACTCGGGCTCCGATATTG 
600 610 620 630 640 650 

670 680 690 700 710 720 

mRNApo t CTGTTGAGCTGAGTAAGAATGCTGCTCAGGTTTTTATCAGCACCAGGCATGGCACCTGGG 

• «•••*•■•■•••••••• •■•••■•••••■•••••■•I?***"***!"*!*****!**! 

Macaque CTGTTGAGCTGAGTAAGAGTGCTGCTCAGGTTTTTATCAGCACCAGGCATGGCACCTGGG 
660 670 680 690 700 710 

730 740 750 760 770 780 

mRNApo t TCATGAGCCGTATCTCTGAAGATGGCTATCCTTGGGACTCAGTGTTCCACACCCGGTTTC 

Macaque TCATGAGTCGTGTCTCTGAAGATGGTTATCCTTGGGACTCGGTGTTCCACACCCGGTTTC 
720 730 740 750 760 770 

790 800 810 820 830 840 

mRNApo t GTTCTATGCTCCGCAATGTACTGCCACGAACAGCTGTAAAATGGATGATAGAACAACAGA 

Macaque GTTCTATGCTCCGCAATGTACTGCCACGAACAGTTGTAAAATGGATGATAGAACAACAGA 
780 790 800 810 820 830 

850 860 870 880 890 900 

mRNApo t TGAATCGGTGGTTCAACCATGAAAATTATGGCCTTGAGCCTCAAAACAAATACATTATGA 

Macaqu e TG AATC AGTGGTTC AACC ATG AAAATTATGGCCTTG AGCCTC AAAAC AAAT AC ATTATG A 
840 850 860 870 880 890 

910 920 930 940 950 960 

mRNApo t AGGAACCTGTACTAAATG ATGATGTCCCAAGTCGTCTACTCTGTGGAGCC ATC AAGGTGA 

Macaque AGGAACCTGTACTAAATGATGATGTCCCAAGTCGTCTACTCTGTGGAGCCATCAAGGTGA 
900 910 920 930 940 950 

970 980 990 1000 1010 1020 

mRNApo t AATCTACAGTGAAAGAGCTCACAGAAACTTCTGCCATCTTTGAGGATGGAACAGTGG AGG 

Macaque AATCTACAGTGAAAGAGCTCACAGAAACTTCTGCCATTTTTGAGGATGGAACAGTGGAGG 
960 970 980 990 1000 1010 

1030 1040 1050 1060 1070 1080 

mRNApo t AGAAC ATTGATGTCATC ATTTTTGCAAC AGGATATAGTTTCTCTTTTCCCTTCCTTGAAG 

Macaque AGAACATTGATGTCATCATTTTTGCAACAGGATATAGTTTCTCTTTTCCCTTCCTTGAAG 
1020 1030 1040 1050 1060 1070 

1090 1100 1110 1120 1130 1140 

mRNApo t ATTCACTCGTTAAAGTAGAGAATAATATGGTCTCACTGTATAAATACATATTCCCCGCTC 

Macaque ATTCACTTGTTAAAGTAGAGAATAATATGGTCTCACTGTATAAGTACATATTCCCAGCTC 
1080 1090 1100 1110 1120 1130 
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Align emen t -mRNAFM02 



1150 1160 1170 1180 1190 1200 

mRNApo t ACCTGGACAAGTC AACCCTCGCGTGCATTGGTCTCATCCAGCCCCTAGGTTCCATTTTCC 

Macaque ACCTGGAGAAGTCAACCTTTGCATGCATTGGTCTCATCCAGCCCCTAGGTTCCATTTTCC 
1140 1150 1160 1170 1180 ngo 

1210 1220 1230 1240 1250 1260 

mRNApo t C AACTGCTGAACTTCAAGCTCGTTGGGTGACAAGAGTTTTCAAAGGCTTGTGTAGCCTGC 

Macaque CAACTGCTGAACTTCAAGCTCGTTGGGTGACAAGAGTTTTCAAAGGCT^ 

1200 1210 1220 1230 1240 1250 

1270 1280 1290 1300 1310 1320 

mRNApo t CCTCAGAGAGAACTATGATGATGGACATTATCAAAAGGAATGAAAAAAGAATTGACCTGT 

Macaqu e CCTCAGAGAGAACTATGATG ATGG AC ATTATC AAAAGGAATGAAAAAAGAATTG ACCTGT 
1260 1270 1280 1290 1300 1310 

1330 1340 1350 1360 1370 1380 

mRNApo t TTGGAGAAAGCCAGAGCCAGACGTTGCAGACCAATTATGTTGACTACTTGGACGAGCTCG 

Macaque TTGGAGAAAGCCAGAGCCAGACGTTGCAGACCAATTATGTTGACTACTTGGATGAGCTCG 
1320 1330 1340 1350 1360 1370 

1390 1400 1410 1420 1430 1440 

mRNApo t CCTTAGAGATAGGTGCGAAGCCAGATTTCTGCTCTCTCTTGTTCAAAGATCCTAAACTGG 

Macaqu e CCTTAGAGATAGGTGCGAAGCCAGATTTCTGCTCTCTCTTGTTCAAAGATCCTAAACTGG 
1380 1390 1400 1410 1420 1430 

1450 1460 1470 1480 1490 1500 

mRNApo t CTGTGAGACTCTATTTCGGACCCTGCAACTCCTATNAGTATCGCCTGGTTGGGCCTGGGC 

Macaque CTGTGAGACTGTTTTTCGGACCCTGCAACTCCTATCAGTATCGCCTAGCTGGGCCTGGGC 
1440 1450 1460 1470 1480 1490 

1510 1520 1530 1540 1550 1560 

mRNApo t AATGGGAAGGATTCAGAAATGCCATCTTCACCCAGAAGCAAAGAATACTGAAGCC ACTCA 

Macaque AATGGGAAGGAGCCAGGAGTGCCATCTTCACCCAGAAACAAAGGATACTGAAGCCACTAA 
1500 1510 1520 1530 1540 1550 

1570 1580 1590 1600 1610 1620 

mRNApot AGACTCGGGCCCTGAAGGATTCATCTAATTTCTCAGTTTCTTTTCTGTTGAAAATCCTGG 

Macaque AGACTCGGGTCCTGAAGGATTCATCTAATTTCCCAGTTTCCTTTCTC 

1560 1570 1580 1590 1600 1610 

1630 1640 1650 1660 1670 1680 

mRNApo t GCCTTCTTGCTGTTGTTGTGGCCTTTTTTTGCCAACTTCAATGGTCCTAGTCAGCATAAT 

Macaque GCCTTGTTGCTGTTGTTGTGGCCTTTTTCTGCCAACTTCAATGGTCCTAGTCAGCATAAC 
1620 1630 1640 1650 1660 1670 

1690 1700 1710 1720 1730 

mRNApo t GCTTTGGGCTTTATTATCTTGTCAGTCACTACCTCCTAAAG AAAAAAAAAA 
:::::::::::::::::::::::::::::::::::::::::::::::: :X 
Macaque ACTTTGGGCTTTATTATCTTGTCAGTCACTACCTCCTAAAGAAAAAAAAAAAAAAAAAA 
1680 1690 1700 1710 1720 1730 
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Alignenvent-ProtFM02 



>gi 11388193 (U59453) flavin-containing monooxygenase form 2 [Macaca mulatta) 
Length = 535 

Score = 2723 (1271.0 bits). Expect = 0.0, P » 0.0 
Identities = 515/535 (96%) , Positives = 524/535 (97%) 

mRNApot: 1 MAKKVAVIGAGVSGLISLKCCVDEGLEPTCFERTEDIGGVWRFKENVEDGRASIYQSWT 60 

MAKKVAVIGAGVSGLISLKCCVDEGLEPTCFERTEDIGGVWRFKE VEDGRAS I YQSWT 
Macaque: 1 MAKKVAVIGAGVSGLISLKCCVDEGLEPTCFERTEDIGGVWRFKEKVEDGRASIYQSWT 60 

mRNApot: 61 NTSKEMSCFSDFPMPEDFPNFLHNSKLLEYFRIFAKKFDLLKYIQFOTTVLSVRKCPDF S 120 

NTSKEMSCFSDFPMPEDFPNFLHNSKLLEYFRIFAKKFDLLKYIQFQTTVLSVRKCPDFS 

Macaque: 61 ntskemscfsdfpmpedfpnflhnsklleyfrifakkfdllkyiqfqttvlsvrkcpdfs 120 

mRNApot: 121 SSGQWKWTOSNGKEQSAVFDAVMVCSGHHILPHIPLKSFPGMERFKGQYF HSRQYKHPD 180 

SSGQWKWTQSNGKEQSAVFDAVMVC+GHH LPHIPLKSFPG+ERFKGQYF HSRQYKHPD 
Macaque: 121 SSGQWKWTQSNGKEQSAVFDAVMVCTGHHFLPHIPLKSFPGIERFKGQYFHSRQYKHPD 180 

mRNApot: 181 GSEGKRILVIGMGNSGSDIAVELSKNAAQVFISTRHGTWVMSRISEDGYPWDSVFHTRFR 240 

G EGKRILV1GMGNSGSDIAVELSK+AAQVFISTRHGTWVMSR+SEDGYPWDSVFKTRFR 
Macaque: 181 GFEGKRILVIGMGNSGSDIAVELSKSAAQVFISTRHGTWVMSRVSEDGYPWDSVFHTRFR 240 

mRNApot: 241 SMLRNVLPRTAVKWMIEQQMNRWFNHENYGLEPQNKYIMKEPVLNDDVPSRLLCGAIKVK 300 

SMLRNVLPRT VKWMIEQQMN+WFNHENYGLEPQNKYIMKEPVLNDDVPSRLLCGAIKVK 
Macaque: 241 SMLRNVLPRTWKWMIEQQMNQWFNHENYGLEPQNKYIMKEPVLNDDVPSRLLCGAIKVK 300 

mRNApot: 301 STVKELTETSAIFEDGTVEENIDVIIFATGYSFSFPFLEDSLVKVENNMVSLYKYIFPAH 360 

STVKELTETSAIFEDGTVEENIDVIIFATGYSFSFPFLEDSLVKVENNMVSLYKYIFPAH 
Macaque: 301 STVKELTETSAIFEDGTVEENIDVIIFATGYSFSFPFLEDSLVKVENNMVSLYKYIFPAH 360 

mRNApot: 361 LDKSTLACIGLIOPLGSIFPTAELQARWVTRVFKGLCSLPSERTMMMDIIKRNEKRIDLF 420 
L+KST ACIGLIQPLG5IFPTAELQARWVTRVFKGLC LPSERTMMMDIIKRNEKRIDLF 
' Macaque: 3 61 LEKSTFACIGLIQPLGSIFPTAELQARWVTRVFKGLCHLPSERTMMMDIIKRNEKRIDLF 420 

mRNApot: 4 21 GESQSQTLQTNYVDYLDELALEIGAKPDFCSLLFKDPKLAVRLYFGPCNSYXYRLVGPGQ 480 

GESQSQTLQTNYVDYLDELALEIGAKPDFCSLLFKDPKLAVRL+FGPCNSY YRL GPGQ 
Macaque: 421 GESQSQTLQTNYVDYLDELALEIGAKPDFCSLLFKDPKLAVRLFFGPCNSYQYRLAGPGQ 480 

mRNApot: 481 WEGFRNAIFTQKQRILKPLKTRALKDSSNFSVSFLLKILGLLAWVAFFCQLQWS 535 

WEG R+AIFTQKQRILKPLKTR LKDS5NF VSFLLKILGL+AVWAFFCQLQWS 
Macaque: 4 81 WEGARSAIFTQKQRILKPLKTRVLKDSSNFPVSFLLKILGLVAVWAFFCQLQWS 53 5 
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fragmentl . FMOx 

AAACAAGAAA GCTAACTCTC ACCCOTTCTA TTCAATGTAG AACTGAAAGT CdTAGCCAGA 
10 20 30 40 50 60 

CAATCAAGCA AGAGAAAAAA AAATCAAATC AGAAATGAAA ATGGTAAATT GCCTTTATTT 
70 60 90 100 110 120 

ACAGTTGACA TCATATTTTA TATAGAAAGC CCTAAAGACT TCACCAAAAA CTTTTATAAC 
130 140 150 160 170 180 

TAATAAACAC ATTCAGTAAA CTTGCAGGAT AC AAAATC AA CACTAAAAAA TGGATTGCAT 
190 200 210 220 230 240 

TTCCATACAC CAACAACAAA CTATCCAAAA AAGAAATTAA GAAAGAAATT CCATTTACAA 
250 260 270 280 290 300 

TAGCATCAAA AAGAAAAAAT ACTTAGGAAT ACAATTAGCC AATAAGGTGA AACATCTGGA 
310 320 330 340 350 360 

CATTTAAAAC TATAGTCTTT AAGGCAATTG AGGAAGACAC AAAAGAATGC AAAG AT ATTT 
370 380 390 400 410 420 

TGTGTTCATT AATTAATATT GTTAAAATGT CC AT ATAATC CAAAGCAATT TACATATTTA 
430 440 450 460 470 480 

ATGCAATCCC TTTCAAAATA TAAATACCAT TTTTCACACA AATATGAAAA AACATTCCTA 
490 500 510 520 530 540 

AAATTTATAT GGAACCAAAA ATATCCCAGA TAGCCAAAGC AATCTTG AGC AAAAAGAACA 
550 560 570 580 590 600 

AAGCTGGAAT CATCAGACTA CCTGATTTCA AAATATATTA CAAACCTATA GTATTCAAAA 
610 620 630 640 650 660 

CAGTAATGTA CTGGCACCAA AACAGACACA GACCAATGAA AG ACT AT AG A GAGCCACCTA 
670 680 690 700 7-10 720 

ATTACC CAC A CATATACAAC CAACTAATCT TTGACAAAAG TCCCAAGGAC ACACAATGAG 
730 740 750 760 770 780 

AAAAGGATAG TTTCTTCAAT AAATCGTGGT GG AAAAAATT GGATATCCAC ATCCAAAACA 
790 800 810 820 830 840 

ATGAAATTGG ACCCTTAGCT CACACAATAT GCAAAAATTA ACTCAAAATA TATTAAAGAC 
850 860 870 880 890 900 

TTAAACTCTA AGTATAACAT GTATATAAAT CATGAAACTG TAAAACTACT GAAAATAAAA 
910 920 930 940 950 960 

ACATAGAGAC AAAGCTTTTT GAGATTTGTC TGGGCAATGA TTTTTTCACA TATAACCCCA 
970 980 990 1000 1010 1020 

AAACCATAGG CAACAAAAGC AAAAAGGKGC CCAATCTGAC TGGCTTCAAA TTAAAAGGCT 
1030 1040 1050 1060 1070 1080 

TCTATTACAG GAAAGGAAAC AACATAGTGA AGAGACAACC TATAGAATGA CAGAAAAGAT 
1090 1100 1110 1120 1130 1140 

TTCCAAACCA TGCATCTGAT ACGGGGTTAA TATCAAAATA TATAAGAAAC GTAAACATCT 
1150 1160 1170 1180 1190 1200 

CAACAGCAAG AAAACAAATA ACCCGATTTT AAAATGGGTA AAGGACCTGA ATAAACATCT 
1210 1220 1230 1240 1250 1260 

AAAAAAAAAA TGGCCATATG AAAAAATGCC CAACATCACT AATCATCAGG AAAATGCTAA 
1270 1280 1290 1300 1310 1320 

TCAAAACAAC AAGATATCAC CTCACACCTA TTAGGATGGC TATTATCAAA AAGATGAAAG 
1330 1340 1350 1360 1370 1380 

ATAACAACTG TTGGTGAGGA TGTGGAGTAA AGGCAATCCT TGAATGCTGT TGATGGGAAT 
1390 1400 1410 1420 1430 1440 

GTAAATTAGA ATAGCCATTA TGGGAAACAG TATGAAGGTT CCTCAAAAAA GTAGAATAGA 
1450 1460 1470 1480 1490 1500 

ACTACCATAT GATTCTGCAA TCCTACCTCT GGGTATATAT CCACAGGACA TGAAATCAGT 
1510 1520 1530 1540 1550 1560 
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AAGTCAAAGA CATGTCTGCA CTCCCATGTT CACTGCAAAA TTATTCACAA TGACCAAAAT 
1570 1580 1590 ■ 1600 1610 1620 

ATAGAATCAA CCTAAGCATT TATCAACAAA TGGATAAAGA AAATGTGGCA CTTAACTACA 
1630 1640 1650 1660 1670 1680 

GTGGAATATT ATTCAGGCTT AAAAATGGAA AAC ATCTTGT TGCAACAATA TGGATGAACC 
1690 1700 1710 1720 1730 1740 

TGACAGACAT TTTGCTATCT GAAATTAACC TAGGCCCAGA AAGACAAATA CTGATCATTC 
1750 1760 1770 1780 1790 1800 

TCACTTACGT GCAGAATCTA CAAAAGATAA ACTCACAGAA GCAAAGAGTA GTAGGGTGAT 
1810 1820 1830 1840 1850 1860 

TTCCAGGGGC TTGAGGGTGG GGGAAATTGA GTAATCTTGT TCAAATGGTA CAAAGTTTCA 
1870 1880 1890 1900 1910 1920 

GTCATGCAGG ATGAATATGT TCTGGAGATG TAATGTACAA TATGGTGACT ATGGTTAAAA 
1930 1940 1950 1960 1970 1980 

TACTGTATTG TATCCTTCAA ATTTGCTAAA ACAGTAGATC TTAAATCTTC TCACTCAAAA 
1990 2000 2010 2020 2030 2040 

ATAATGGTAA CTATCTCAGC TGATAAGTAT GTTAAATACC 7TATCATTTC ACAATGGCGA 
2050 2060 2070 2080 2090 210C 

GAT AT AT AT A TATACGATGT TTTGTGCCTT AAATATACGC ACTTTTTATT TGTCATACAC 
2110 2120 2130 2140 2150 2160 

CTTACCTCAT GGTTTGCATT CTGCACTCTG CCCAACTTTC CGTGTCCACT CTCTTGGCTA 
2170 2180 2190 2200 2210 2220 

TGTGCTCTTG CTCCCATGGT CCCTGTAGCT GACAACACTT TCCACCCATT TCAAACCACA 
2230 2240 2250 2260 2270 22B0 

CATTTTTCTT CATTCTTCAA AGTCCTTTCT CAAACACTGA TGAAAATGCA AATCTTCCTC 
2290 2300 2310 2320 2330 2340 

CAGTCCCCTC CC AC AG ACTA AATTTCTCAC CCTTCTAGGT TTAAATAGCC CCTTTTAAGA 
2350 2360 2370 2380 2390 2400 

CTCTGTTACT ATCTGAATCA TCGTCAAAAC TGTAGCATAG TTAACAATGT ATGTGTCTTC 
2410 2420 2430 2440 2450 2460 

CTCTCATCTA TCTGCCCTAA TGCTGTGACT CATACCTATT AAATATTTCG TACATAATAA 
2470 2480 2490 2500 2510 2520 

TTC CTTTTCT TTTCCTTTTC TTTTCTTTC T CTTAAGGGGA GGCAGCACAT CTTCACAGTC 
2530 2540 2550 2560 2570 . 2580 

CTGCCACATC TTAGTTGTAT TAATTGTGCC AGGTTAACCT GCTAAGCCCC AGTCTTTCTT 
2590 2600 2610 2620 2630 2640 

CAGAAAAATG GCCACAGTAA TACTTGCCTT AT AAG GT ACT TTTGAAAACA AATAACATAA 
2650 2660 2670 2660 2690 2700 

TGTGTCTAAA GTGCTTAGTT TAGTGCCTGG CACCCAGTGA ATGCACATTC TAAAGTGATT 
2710 2720 2730 2740 2750 2760 

ATTTTTAGTG GTATTTTC CC CCATCATTTC CTGACTGTGA GGCACTCTGA AGCATTTTAC 
2770 2780 2790 2800 2810 2820 

ATACCATGTC TCAGACTCTG CACTAGAACT TAGCTTCCTA GGAGACGTTA CTCTGTCCTT 
2830 2840 2850 2860 2870 2880 

TTTTGTTGCC ACTGTATCTG TAACATTGCA AACAATGCCT GGCATGCAGT AAATGCTCGA 
2890 2900 2910 2920 2930 2940 

TTAATACTTC TTGAATAACC CTCTGAAGGT TCCATACTCT CTAAAGTAAG AGTATCTTCT 
2950 2960 2970 2980 2990 3000 

TCATACTCTC TAAAGTATCT CTTCTCACTA TTCCCATTTA TA5GGTATTG GAAAAAACAT 
3010 3020 3030 3040 3050 3060 

AGCATCAAGT CATCAATTTT TCCTGGCTTA GCAAATTTGA ACAGTTCAGT TTTTCATTAG 
3070 3080 3090 3100 3110 3120 
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TATATTGAGA ATAATAATAC CTGCCTCACA AGGTTAATGG AAGAAAATAA ATGAAAAGCA 
3130 3140 3150 3160 3170 3180 

CTTTGAAATA CGTGTCAGCA TTCTGAAGAT GTTCATTAAT CTCAGTCTAT TCTTAATCCT 
3190 3200 3210 3220 3230 3240 

CTTCTTGGAG TGGCTAGTGT GAACCATTAG GGGCTGCAAG CTCAGTGGTA TGACCTATAG 
3250 3260 3270 3280 3290 3300 

AGCCCTGAGC TTTAAGAGAA AAGCATGGAA CTTTAAGTAC AAGGAGACAT GGAAAGGCCA 
3310 3320 3330 3340 3350 3360 

CAGAGAGGTA GATTCCCACC TGAGGGGGAG GTAGAGAAGC TCTGGAAATG ATCACCTTTA 
3370 3380 3390 3400 3410 3420 

TCCCTTGCCT TAACATATCT CTTCCTCCTG GGTCCTCCAT AGTACTCAGG CTCAGCCTCA 
3430 3440 3450 3460 3470 3480 

AGATGGTTCA CCAGTAGAGA ACTGCTGGCG CTGAAGAAGA AGAAGACACT CTGGACAATG 
3490 3500 3510 3S20 3530 3540 

TTCTCCCCTT GTTTCATGAT CTTGCTCACT TTGGCCTATC AAATAACTCC AGGGACTTCA 
3550 3560 3570 3580 3590 3600 

TCTTTTAGTT GATTAAGTAC CTGGGATACC ACCTTCTTAT AGCTCTAAAG ACACTCCCAA 
3610 3620 3630 3640 3650 3660 

CCTATGAGAA TGCAGGGGGA GGCAGGAGAT CCACAAGGTC TGATTTTCCT GATCATTTTT 
3670 3680 3690 3700 3710 3720 

GAGTAACAGG ACTTTCTCTG ATCTCATTAA ATCACAAATG CAGTCTCAAT CCGGAAAATA 
3730 3740 3750 3760 3770 3780 

GATCCCATCA TATGTGATAA TCAAAACCTT GGACTTTACT TTCAGCTCTA ATCTTTTCAG 
3790 3800 3810 3820 3830 3840 

TATTACCTTC AGCTGAACCT GCACCTAGGA GAAGCCTGAG CTCCTGGAAG GCAAGCATGA 
3850 3860 3870 3880 3890 3900 

GGCTTTTCTC CTATATCGCC TTATGCTTCC ACTCCTCCTC CCCATGATGC TGATGGAAAA 
3910 3920 3930 3940 3950 3960 

GTTTCCAACC CTTTCAGAAA ATTATATTTT CTGTCTTTGA AAAGCTGACA TTTTACAAAT 
3970 3960 3990 4000 4010 4020 

CTCTTAATTT CCTTAATACA CTCAGGTCTA TGCAGCAAAT TAAGAGATTT GTAAAATGTT 
4030 4040 4050 4060 4070 4080 

GAAGGGATAT TAGTAATTAC TTAATCCAAT TTGCTTATCT TACAGGGGAA GGATCTAAAT 
4090 41QQ 4110 4120 4130 4140 

TCCTGCAAGA ATTATCCCAA AATATAC A C C CAAAGACATG AATCACTCAG TTTTT AACTA 
4150 4160 4170 4180 4190 4200 

TAATATTAG A TAACAGTATG AATATTTTTA AAATTTATAA GAAGACAGAA CTGCCTTTCA 
4210 • 4220 4230 4240 4250 4260 

TTTAATATCA T AC GT ATT AC AAGAATTGGA AAGCTAAAAA ACCACATTTC T AAG ACTCTC 
4270 4280 4290 4300 4310 4320 

TTGCAGTTAG GGATTCGATC CAATTAGTTT TGCCAGTGAG ACAGACATCT AGGCTCAGAA 
4330 4340 4350 4360 4370 4380 

GGCAAAGGGA AGCAAAAGCT AAATTTTCGT GACAATGCTG ATGGGCAAAT GTATTCCAAC 
4390 4400 4410 4420 4430 4440 

AGGTGTGCTT ATATCAGCTG AACTCCATGT TCCACCTTTT AGCCCCCCAA TTTGTATGTT 
4450 4460 4470 4480 4490 4500 

GCAGGCATCT GTGGTGATTG AAGCACTTTC CTGCCCTCTG GATAGTACCT CTAGTGGTGT 
4510 4520 4530 4540 4550 4560 

GACCTCTCCA GTCCTGCAGC AACCTCCTAG TTCCTCCTCT TTCAGCTCTT TCACCTTT T G 
4570 4580 4590 4600 4610 4620 

CAAGCACCTA ATTCCCTCTA GTATATACCT TTCTTCATGA TATATAGTGT TTTTTATCTC 
4630 4640 4650 4660 4670 4680 
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CTGCACTAAA TCATGAGCAT ATGCATATAA ATCATAATAT GAAATCTTAA AAACAGAAGT 
4690 4700 4710 4720 4730 4740 

ACTTTTGC TG AGGCATTAAG C AT ATAATC A GTCAGCAGGT CCCCAAACAT CTAATTCCTG 
4750 4760 4770 4780 4790 4800 

AATATCTCAT ATATCCTGTC TCCATTATCC ATTCCTCTAA TGCTACTCTA ATTTAAGTCC 
4810 4820 4830 4840 4650 4860 

TCAGTCTCTC TGCCCTAGAT TGTTGAAATA ACATCCTGGG TTTTTGGTCT CCTTGATTCT 
4870 4380 4890 4900 4910 4920 

AGTCACCATC CTCTCTAGCC TCCAGGTGAA TCTGATCTTG TCTGATGTTG TCACTTCCTT 
4930 4940 4950 4960 4970 4960 

CTTCAAAATT CTCGAATGGA CAACCGTAAT CCAGAAGGTA GTATCCAAAC CTCTGATTCT 
4990 5000 5010 5020 5030 5040 

GGCACTTCAG TATCCTTCAT AAC CTATGTC CTGCATGTTT AACCCATATT TTGCTATTCC 
5050 5060 5070 5080 5090 5100 

CATCACTTAT GGTCCAGCAA AACTGAACTA ATTGTAGTTC CCCCATCACG TGTTCTTACT 
5110 5120 5130 5140 5150 5160 

TTTCTATGCA TTTTCACATA TTTTTCTCTC TGCCTTTTTT CTATTTCTTG TCCCTTATCT 
5170 5180 5190 5200 S210 5220 

GTCTGGAAAA CATCTATTCT TCCTTCAAGA CTCAGCTCTC TTCTCACACT CCTTGAACCC 
5230 5240 5250 5260 5270 5280 

TCTCTTTCCT CCTCCAAGTG GACCTAGATT TTTCTTCCTA CATGCTAGCA CTACACTGAA 
5290 5300 5310 5320 5330 5340 

CCATACTTCC ACTGTCACAT TTATCATCTC CCTCAACACT AGACTTCATG CTTCCAGATG 
5350 5360 5370 5380 5390 5400 

GAAAGCACTC TCTCTTCTCA CCTTTGAATC CCCCAAAAGA CTATTATAAT CCATGACATA 
5410 5420 5430 5440 5450 5460 

TAGTAGGCTG TCAGTACAGT GAAAGGAATG GCCAGAGGAA GGAAAGGAGG GAAACACAAG 
5470 5480 5490 5500 5510 5S20 

CAGAAAGGAC AGGTATAGAA GCCGGAGGGA GCCAGAGACA AGCTTCAGAG ACCACAATTC 
5530 5540 5550 5560 5570 5560 

TGTCTTTTGA GTTCACTAGT TTTACAAGCT CATCTATAAG CGTTAGTTCA CCAACTCAGA 
5590 5600 5610 5620 5630 5640 

TCAGGCCCTA ACTTTCCAGA AATTTGAGCT ACTTTTCACT GTTGCCACAA CAAAACCTTT 
5650 5660 5670 5680 5690 5700 

CATTATAGTC CAGGTGCATA GCCTTTGTTT ATATATTCTA T ATTTC C AAA GCAAACATAA 
5710 5720 5730 5740 5750 5760 

ATGAAAGAAT CATTGTTCCC CTAATCTCCC AGGACTTTCA CCTTACAGCT CCAGTGGCCA 
5770 5780 5790 5800 5810 5820 

TGCCAGTCAC TCTTTTATAT TTTTTCTAAC AAGAACCAAA GACTTCATTC TTCC TTTTT C 
5830 5840 5850 5860 5870 5880 

CTACCCCTTT CTTTTTACTT CACCCATGCC TCCCCTGTTC TTCTCTTATC CCTACCACAC 
5890 5900 5910 5920 5930 5940 

TCGTCCTTCT CTTTCAGATT TTACTATGGC TCTATACCAT TAAAAATACA AGAAAAAAAA 
5950 5960 5970 5980 5990 6000 

GGAATTTTAC TTTAAGAATA ACTCCTCCCC CTTCCCCAGT TTTCACATCA AAAGACATTG 
6010 6020 6030 6040 6050 6060 

TTAAATGCCA TTCTCTTCCA CATTTCGAGA ACTGCTGATT CTCTGGGGAG AGAAAGGTGA 
6070 6080 6090 6100 6110 6120 

TTGCTTAAGA GGTGAAGTCC CTTAGAGCAT TCAAAATGAG GAGTGATTCT GTACAGAGGA 
6130 6140 6150 6160 . 6170 6180 

TATCATGCAG CAGGCTGGAT CTCTACTTCC AATTCCTTTA TTTGTTACCT CTGACACCTT 
6190 6200 6210 6220 6230 6240 
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GAAGAAGTAG TTTCTAGTCT CAGCATACCA AAGCGTCATC TGCAATTGAG AGCATTGGAT 
6250 £260 6270 6280 6290 6300 

TGATGATCTT CAAGGTCCTT CCTGCTCTAG CATTCACTGA ATCTGCTATT TTTGACATAT 
6310 6320 6330 6340 . 6350 6360 

TGAATAATCA GAAGCAGCCA GTTTTAGAAT CTTATTATAG CAAAAGTGGT AAAAATAATG 
6370 6380 6390 ' 6400 6410 6420 

AGCATAT AC T ATCAATGTGC ATCTATGTCT TCTTATGTTT GAGTGAGGAT CCTGATACAT 
6430 6440 6450 6460 6470 6430 

AAACCTTGGC TGATAATTTC TACTGAAAAA AATCGTAAGT ATTAAA G AC A CTCTTCTCAA 
6490 6500 6510 6520 6530 6540 

GATGTTCTCT CCAGACTCTG CTACAGGCAA TCATGAGCAA GAGGGTTGGC ATCATCGCAC 
6550 6560 6570 6580 6590 6600 

CTGGAGTCAG TGGCTTGGCT GCCATATGGT GCTGTCTGGA GGAGGGCCTC GAGCCCACTT 
6610 6620 6630 6640 6650 6660 

GCTTTGAAAG GAGCGATGAT CTTGGAGGCC TGTGGAAATT CTCAGTGAGT GGCACATCAT 
6670 6680 6690 6700 6710 6720 

TAGAACACCA GTGGAAGGAG ATGGATTCCA ATGCAAATCA AATCTGATCA GTTCTAATTC 
6730 6740 6750 6760 6770 6780 

AGATTTAGAA GGCAGATCAC AAAAGCTCCA AATCTGGAAA GTAAAATCTT ACCTCTCCAA 
6790 6800 6810 6620 6830 6840 

TCATACTAAT NGCCCAAAAA AACTATTTCA TACCAGCAAA ATTTGTCCTC AAAAGGACAT 
6850 6860 6870 6880 6890 6900 

TTTCAGCTCA TTAAACATCA TCACCTGCAT GGTCAAATCC AGATCTCCAA CCTGTAAAGG 
6910 6920 6930 6940 6950 6960 

GCACTAATGT TG GTAATT AT TCAAAAATAT ACCATGGGCT TCCCAGGTAA GTCAAACAAT 
6970 6980 6990 7000 7010 7020 

TCTATTCTTT ATTGCTCTTA AATGCCAGGA ACACGACTAG AAAAGAGACA AACAAACCTG 
7030 7040 7050 7060 7070 7080 

GACTGAGATC CTGAGGTCAG AAGTCCTGAG TTCTAATTTC AACTTGTAGC TTTTCTAGGC 
7090 7100 7110 7120 7130 7140 

AG AT AAG ATT TCAGTCCAGT TGCTTTTCTT TCCCTGGACC TCAAATGCTC ATTT GTC AAA 
7150 7160 7170 7180 7190 7200 

TGCAGAGGAT ATG ATTCT AT AATTAACTTA TGTCTATTGG CC AG AT AG AG yVTTATTATAG 
7210 7220 7230 7240 7250 7260 

ATG ATG ATT G TGTGTGCGGC TGTTGAATAG CCTATCAGCT CCAAATCCAG AGGGAAAAAT 
7270 7280 7290 7300 7310 7320 

TATGGTCTTT GCCATTTGGG CTCATTGTAG AAATAATATA ATTAGGAAAT AGTCCTTGTA 
7330 7340 7350 7360 7370 7380 

AACACATTTT TTTTTAAATT TCAAAGCCAA GTTTGGAGAA ACTTCTAGTT CTTCTGTCCT 
7390 7400 7410 7420 7430 7440 

GGATTTCCCA GCCATTGTAA TCAGTTGTCG ATG ATAC AT A TTTGGCTTGA AAACATATTC 
74S0 7460 7470 7480 7490 7500 

ACATC ATTC A TATTGTAACT ACTTCCTGTC CTGGTCTCAG TTACTCCTCT GCCTGCGCCA 
7510 7520 7530 7540 7550 7560 

ATAGCCTCCT CCAATAGAGT ATATCAGTGC TAACTTAGAA CACATTTTTA TTCTTCTCCA 
7570 7580 7590 7600 7610 7620 

AGCTTTTTTT AAAAAAAATT GTGGTTTTGT AACCCTGAAA GCACTCCATG AGATATAAGG 
7630 7640 7650 7660 7670 7680 

TCATTAATTT TTATTTCCCA GTAGGGGGTA ATCAAGAGTT AATATTTTTC AAGAATTTAA 
7690 7700 7710 7720 7730 7740 

TTTTCCCTAT TTACATTTCC TCAGGGAAAT GTGGACAGCT TAGAGTAAAT CATAAAATGG 
77S0 7760 7770 7780 7790 7800 
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CTTTCTAC C A TCTCCCTAGT AACAATTAAA TGATGCTTGA GCATCTATTC TGGTAGTTTG 
7810 7820 7830 7840 7850 7860 

TCCTAAGTAC TGGGATGACA AATATGGAAT ATAATCACTC CTTGTAAATG CTTCCATTTC 
7870 7880 7890 7900 7910 7920 

ATTTG ATTAA GCAAGCCATA AT AT AATTC C GTAATCCTTT GATAGCAAAT GGGCAAAAAC 
79 30 794 0 7950 7960 7970 79 80 

TCATTTGATA GCCGAACCTC TTCTGAAATC GTAAGGTTAA ATACCGTGAA TTGGATCAAC 
7?90 8000 8010 8020 8030 8040 

ATGAAGCTAA GTCTCACCTT CTGTTGCACC GCAGAAATTT TATTGCATTT GACAGATTGC 
8050 8060 8070 8080 6090 8100 

TGCCCCAGAT CTCACTAGGA GTATTATGGA GCAAAATCCA AAAATGTACA CATTCCAAAA 
8110 8120 8130 8140 8150 8160 

T AT ATCTGGC CCTAAGACTT TTAAAATAAG AG ATT AT AT A ACT AC AAC AA CAAGATAGAC 
8170 8180 8190 8200 8210 8220 

CTTGTCACCA TCAATTCAAT GGACGAGTGC CTCGAGCCTT TAGAAGAGGG TGGACTACGG 
8230 8240 8250 8260 8270 8280 

AAATCTTAGT AGGTCAAAGA AAACCTCCCA CAGGGATGAC ACTTAGCCTT GAAGGATAAC 
8290 8300 8310 8320 8330 8340 

CCCAGACAAG CAAAATAGAG GACCACCTCT GACACAACTC CTAGAGACTC CATTTCCCAA 
8350 8360 8370 8380 8390 8400 

TAAAGTCTGC GAATGGCACT CCATAGGCCT ATGCAGTCAT TGGCAGTGTC CCAGCACCAG 
8410 8420 . 8430 8440 8450 6460 

CTTAAGAGAC ACCAACAATC CATGAAAGGC ACAGAAAAGG CAATGAACAT GGTCTCTGCA 
8470 8480 8490 8500 8S10 8S20 

GAGAGGGATC CATGAGTTAT CCAATATACC CAGATCAGAA ACTTTACTTA AGGAAGCAAT 
8530 8540 8550 8560 8S70 8580 

AAT AT G AT AC AAAGATCAGT AAGATTCAAA GTTGGATTCT GAGTTATCCA CAAGAGGAAA 
8590 8600 8610 8620 8630 8640 

TTCTTCTTTT CCATAAGGTC ATCTCTATAA GCAAAATTCT ACTCAAAGTC CTGGTGAGGA 
8650 8660 8670 6680 6690 8700 

TATGGACCCA TACAAATACT CAAAACTTTA GCCTCCTCCA CATACCCCAG CC CTTCCTTC 
8710 8720 8730 874 0 8750 8760 

TTTTCTTACA AAAGTTCCTT GGCACAATAT ATAATCAGAC AGGGATTTTT TTTATCTGTT 
8770 8780 8790 6600 8810 6820 

AC AT AAG ACT TTATCTTCTN AAGNCTTTTT TNCAGAAGCT CTTCTAGCAG AC AG AAACGT 
8830 8840 6850 8660 8870 8880 

GGTAATTCTG AACTTTTCAC TATTTGCTTT TTCTGAGAAA TGAAAACCAA ATGGGATTTA 
8890 8900 8910 8920 8930 6940 

AATACTAGCA GCCTGAATGT GTG TTTT AAC TTTCATCCAC TCCTAAATAG GGCCTCGTGT 
8950 8960 8970- 8980 8990 9000 

CCTCAAAAGA TTTCATTACT GCTGTAATAA GAAGTTGCTC AACAGCCAGG TCCGCTGCCT 
9010 9020 9030 9040 9050 9060 

CATGCCTATA ATCCCAGCAC TTTGGGAGGC CAAAGCGGGT GGATCACGAG AGGTCAGGAG 
9070 9080 9090 9100 9110 9120 

TTCAAGATCA GCCTGGCCAA CACAGAAAAA CCCCATCTCT ACTAAAAAC A CAAAAATTAG 
9130 914 0 9150 9160 9170 9180 

CCAGGTGTGG TGGTGGGTGC CTGTAATCCC AGCTACTCAG GAGGCTCAGG CAGGAGAATC 
9190 9200 9210 9220 9230 9240 

TCTTGAACCC AGGAGGCAGA GGTTGCAGTG ACCTCAGATC ATGCCACTGC ACTCCAGCCT 
9250 9260 9270 9280 9290 9300 

GGGCAAT AG A GAAAGACTCC ATTAAAAAAA AAAAAAATGC TTA 
9310 9320 9330 9340 
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aaaaaaatgc ttaccaatag gttagtagca tcttgattgc aaaagctgaa aacaggacta 

10 20 30 40 50 60 

ttttgaactt tttcccactc atttattcct ttgttcattc aatgaataca tactgtgcac 

70 80 90 100 110 120 

tttacgtgta gggtactata ttaagcataa gctgcagata agaggccagc cagcacttta 

130 140 150 160 170 180 

aaagccgtga gaaaacaagt atcagaataa ctataagtga ctatataatt agggcaataa 

190 200 210 220 230 240 

ggataatggg accctagcaa aactaaagat gatttggcag tagctgagag ggaaggtaaa 

250 260 270 280 290 300 

gaaagccatg acaaagttga aggcaacttt tgagcatatt tcaagggcat atttagacaa 

310 • 320 330 340 350 360 

ggagatatgg gactcataag cagagctgga acaggaaaga agatcaaggt aaactgctta 

370 380 390 400 410 420 

gatgcatgta caacattctg aaattaacct ctaactttgc cctcaagtLa cttatgttct 

430 440 450 460 470 480 

cgtgggaaag atgagagatg aacacggtta tcatccaaga cagatggtgc ccacagctgc 

490 500 510 520 530 540 

ttagatctct ggttccaggg taaagctccc tcagctagag gcagagtcaa agttgaattt 

550 560 570 580 590 600 

cccccttact ggctcaaacc acacctcata ttgaaataat aaaaatgcat gctccctgga 

610 620 630 640 650 660 

gcaactgact tgttatctaa tacatttgct tttttgtgtt tgtttggaga acagtctttt 

670 680 690 700 710 720 

cgaaaaaatt ccaaggagcc gtagtgtaca tactcttctc tcctggtgtt acaattggct 

730 740 750 760 770 780 

gaggccaagg ggcaaaaaag cagagattca ttcaagatgg aaatattcca aggccttagc 

790 800 810 820 830 840 

atctgtttcc cagaacagag tcttacattc tttaaccagg ctccatccca cagttcagcc 

850 *860 870 880 890 900 

ctgcctcctt tcaacaggca gctgaaaaaa cctccttccc acctctcctt ctcacaacca 

910 920 930 940 950 960 

tcagtagaag gcgctagctg tgggtgaaag ggaagcactc agcctgccaa actgctggac 

970 980 990 1000 1010 1020 

atgagccttc accctttttc tgacctccac aaaaatttta aaaagtttaa attcctgtgc 

1030 1040 1050 1060 1070 1080 

ttccacgctt atgagaaata cagcaaecat gaatagagga agattatgtt ttcaacttga 

1090 1100 1-110 1120 1130 1140 

gaaaaaatac tgaggctctg ggcagccccc cacttcccca cggggacaca accctctcaa 

1150 1160 1170 1180 1190 1200 

cccttxccag cactttttgt tcccctcttc cagaggtcat ctggtgtgag agggagatac 

1210 1220 1230 1240 1250 1260 
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acatcttgaa tccagcagca acgtgacatt ccatctcctt ccccccattg cacaagagtc 

1270 1280 1290 1300 1310 1320 

ccttccggac ctcgggaagc agaagctgcc agctctgaaa tgtattttca aggcagcaca 

1330 1340 1350 1360 1370 13BO 

ttgtgtqcac ttttacccta ccctcacaac tgagaggaaa tgtttatttt caatttagct 

1390 1400 1410 1420 1430 1440 

tttgactgct tctaaaaaat aagccacttt tcaattacac agaggcttta aaatgaagtg 

1450 1460 1470 1480 1490 1500 

ccaagattta acacatgttc taagggctct ggtttcctgt gtttctttgg tgaggagtga 

1510 1520 1530 1540 1550 1560 

agtccagcaa ctggtgagcc aaagaatagg attcatttac aacagagcag tggttctcaa 

1570 1580 1590 1600 1610 1620 

agtgtggttc ctaaaccagc cacatcagca tcaccaggaa cttgatagaa atgcaaaaca 

1630 1640 1650 1660 1670 1680 

cccccagacc ccaccccaga cagattgaac ccgaaattcc aagaataggg cccaagaatc 

1690 1700 1710 1770 1730 1740 

tacggtctag ggagcttcca ggcgattctc attacgccaa agctgggaaa ccactgcaat 

1750 1760 1770 1780 1790 1800 

attgggttgt tgccagtgaa gagtttgcta aactccaaaa gcaaataaat aggctagaag 

1810 1820 1830 1840 1850 I860 

tcagagcctc ttctagacag txttgttttt tgtttttttt ttaacctgag tataagatca 

1870 1880 1890 1900 1910 1920 

gaaccagtgg tggcacagga gaaagcaaaa accactaagt ggctataaag acagagctaa 

1930 1940 1950 1960 1970 1980 

cactgagggt aattacagta agaggattca catggaaaga gctccagttc tgtgccaggt 

1990 2000 2010 2020 2030 2040 

tacgcgaagg gctttccatt ccttatctta ctgagagctt ttaatttttg tttacgcttt 

2050 2060 2070 2080 2090 2100 

taaacatgaa aagggtttta gtcaaccaag aattgaacca ctgtgttcac tgaagggaac 

2110 2120 2130 2140 2150 2160 

-acaatt.ct.tg gctttctctt taagctttct tattctccct aggaccacac agaagaaggc 

2170 2180 2190 2200 2210 2220 

agagccagca tttaccagtc tgtattcaca aactcttcca aagaaatgat gtgctttcca 

2230 2240 2250 2260 2270 22B0 

gacttccctt atccggatga ttacccaaac tatatacacc acagcaagct ccaggaatat 

2290 2300 2310 2320 2330 2340 

ataaagacat atgctcaaaa gaaggaactt ttaagataca tatagtttga ggtaggggtc 

2350 2360 2370 2380 2390 2400 

tcataacttg tactgttgaa attaagatat gtgtgggtta gagaaaaagg aggcagcaaa 

2410 2420 2430 2440 2450 2460 

ctattataaa aattagagcc aaatgtttgg gcacctcagt aatcaaatgt tgggtctgat 

2470 2480 2490 2500 2510 2520 
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tataaagcat tcatgcattg attttttctc tcctagactt actagttcac tagtctctga 

2530 2540 2550 2560 2570 2580 

gagcttxcag actaccttag aaaatggagg cagctagccc atcattgtcc actttccacc 

2590 2600 2610 2620 2630 2640 

ctcatgctct gatgttttgg aaataatcca aaatgcttta gtatatatta ggaattttgt 

2650 2660 2670 2680 2690 2700 

cagttcaatg ccaatgagtt gtggttcaaa aaaccagagc atttggtagg gtttctccca 

2710 2720 2730 2740 2750 2760 

ttacattatg aaaaggtnaa caacttaaat gggaaatata gtcattgccc ccatctttac 

2770 2780 2790 2800 2810 2820 

ccactcagtt cattagtttt tttattaaaa aggtgagatt tcagcattgt ttctgcgaga 

2830 2840 2850 2860 2870 2880 

ataatgtttt acatttattt gggactcttt attgagcatt cctgtctgta tgtttggaac 

2890 2900 2910 2920 2930 2940 

tctcaacctc aattaactgc tgctaaatgc agaacacttg catatagtgg gaaaaacaat 

2950 2960 2970 2980 2990 3000 

cagcaaaatt atgaaccatg gcgatattta catcattatt ttacctggag tagccccaaa 

3010 3020 3030 3040 3050 3060 

tgtatagtta aaataaaatt ttccaatagt cattttattc cattcattca ttacattcat 

3070 3080 3090 3100 3110 3120 

ttgcttccat tatggtgtta atatcaacaa acattaatga agtxcctatt gtgtgcttgc 

3130 * 3140 3150 3160 3170 3180 

attgtgctat gtgttatatg taaaagaaaa agaggtctaa gacttagctc tcaagaagct 

3190 3200 3210 3220 3230 3240 

atttcaaaat aaatatgtaa agagcaagta aaaagattcc agcaacaatc tcaatcaaag 

3250 3260 3270 3280 3290 3300 

agaaaatttt ttaaagctct ttatgatttg tttataaata aaacaatgct atggagacca 

3310 3320 3330 3340 3350 3360 

cgaagcaaga ggcaacactt tgggggaagg tattttctag aggaggtaaa atttagttgt 

3370 3380 3390 3400 3410 3420 

atttagcagg tgttttagat aaatgagtgg catgagtaaa attagagagg tgggaaaatg 

3430 3440 3450 3460 3470 3480 

ccctgcncat ttggagaaca gtgggcaaac caagttggtt aggagggaga tatatatgct 

3490 3500 3510 3520 3530 3540 

aggatgagat atggccacat atatcagtaa actagtgtgt actgtgactt tgaaaaatag 

3550 3560 3570 3580 3590 3600 

aggattattt tgcaaccatg taaaagaagt ccaaagaagg gacatccaga gcttatgtga 

3610 3620 3630 3640 3650 3660 

tggcaccaaa gttatcaaag atxcagcttc acccatctta gcaccgtggc ctacatcatg 

3670 3680 3690 3700 3710 3720 

acgtttgccc tgtggcgcaa aacagtcgct gaagcntgag ccgccacacc tgccctctag 

3730 3740 3750 3760 3770 3780 

gcaaaaaaaa aaaa 



3790 
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ttttttt'ttt tttttttgag acggagtctc gctccgtcgc ccaggcggga gtgcagtgcc 
10 20 30 40 50 60 



ccaatctcgg ctcactgcaa cctccgcctc ccgggttcac accattctcc tgcctcagcc 
70 80 90 100 110 120 

tcctgagtag ccgggactac aggcgcccgc caccacgccc ggctaatttt ttgtatttct 
130 140 150 160 170 180 

agtagagacg gggttcacca tgctagccag gatggtcttg atctcctgac ctcgtcatcc 
190 200 210 220 230 240 



acccgcctcg gcctcccaaa gcgctgggat tacaggcata agccaccgcg cctggccgta 

250 250 270 280 290 300 

aagttgctat atttctaaga taagagtatt tatgcagagc aaaagagatg ccaacgatca 

310 320 330 340 350 360 

aaccttgaga tattcccata cttattgagt agatggaaga tgaggtcaga aaaggaggaa 

370 380 390 400 410 420 

gccatgtcag tagagggtag ccataagaaa ataacacaga tttgttatat gacatcattc 

430 440 450- 460 470 480 

acaaaaatat tcagtgtgac ttacccctaa atcaactaac ttgatgtcaa aaagcaaatg 

490 500 510 520 530 540 

tactccagtg agtaattttt cttgtgagat tcaaagactc actgaagatt cactgtgact 

550 560 570 580 590 600 

ccaatttuc catctttcta tacatttctg aacgaccaag agagctcgta acaatcattt 

610 620 630 640 650 660 

cctccacaga aacaaggcaa gaaggaaaaa aactttcaca tgtagaatta taaatggaaa 

670 6B0 690 700 710 720 

aataaatttt ct.agtttt.ct taaagaccct ggtttccggt ataaagaaat gtcccagctt 

730 740 7S0 760 770 780 



cttagtcacg ggccaatggg ttgttgttac tgaaaaggat gggaaacagg aacccactac 

790 800 810 820 830 840 

ttttgatgct ocaatgatcc gttcaggaca tcacgtatac cccaatctgc caacggattc 

650 860 870 BBO # 890 900 

ctttcctggt aagtttggaa aatatataat aatctaggga cttacatgca aacaccaaga 

910 920 930 940 950 960 



gttagaaaca tacctttcta taggtattac ataatgatta ttcttagact tcaaaagaaa 

970 980 990 1000 1010 1020 

aaaattaagt ttaatgatag gatatagtaa taaatagcct cataagtcct tatgtcaaaa 

1030 1040 1050 1060 1070 1080 

taatcaagga ctgcaagcca gagatcagac aaacacaagt tcctgtggag aagtgcggga 

1090 1100 1110 1120 1130 1140 

cccaaaaata agtnctaaca gcacacgggg tctccgagca cagttacatt aaaaaaaagt 

1150 1160 1170 1180 1190 1200 



agagtccaac tgccaaatgg tttaaagaaa gacacgttta cttatgttat ttataggaga 

1210 1220 1230 1240 1250 1260 

ctcctaggtt tctaatttca tcttcantcc acaatttgca aataaacctt agaaatctca 

1270 1280 1290 1300 1310 1320 
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gtgatttgtg tgtgggtaca cacatgggtg tgtgtatagc agcatacttc attaccatcc 
1330 1340 1350 1360 1370 1380 

gaaagtggca aacctcaaat aaatacaata tacatggagg cttccttcca tttttccttc 
1390 1400 1410 1420 1430 1440 

cttccttgcc acaggaacac aatctactca aagatattag agtttccatg tctaggtatg 
1450 1460 1470 1480 1490 1500 

atgtccatag gccgaggaaa attaaagagt gaaggttcag gaggaatata agattaaaac 
1510 1520 1530 . 1540 . 1550 1560 

tcttaatgtt aacgggcagc atatttaatg tttatgagca tgggatcaga acacctggcc 

1570 1580 1590 1600 1610 1620 

tcaacttact attccactag ttccttacca cttaacttct ttgtctcaat tcccccttct 
1630 1640 1650 1660 1670 1680 

tttaaaatag ggacaatagc ccaccatgca gggatgttat caagattaaa tagttaaaac 
1690 1700 1710 1720 1730 1740 

gtgtaaagca tttatcagag gacctagccc acagagttaa cccaataaat attaaccatt 
1750 1760 1770 1780 1790 1800 

attattatcg taacatacat tcccatgcct taagattttt taaggaacta aaagtaagt: 
1810 1820 1830 1840 1850 I860 

ttagggggct taatgtcaaa aaatgctaaa tggataaatg cacttcaact agggaatttt 
1870 1880 1890 1900 1910 1920 

ttaattacaa ctgataatag gtttaaaaag acacaaagaa aacatctLca taat ttctga 
1930 1940 1950 1960 1970 1980 

aaatcagttc aaacaacttg ecatgttcca cttaggcctg gaccagtttc gaggcaacta 
1990 2000 2010 2020 2030 2040 

cccccatagc cgggattata agaatccaga agccttcaag gggaagaggg tcctcgtgac 
2050 2060 2070 2080 2090 2100 

tggtctgggg aattcgggat ctgacattgc tgctgagetc agccgtctgg ctacacaggc 
2110 2120 2130 2140 2150 2160 

acatgacgta aaggttttgg gaaataaacc taaggtaggg ctgtgctact aaatcagtag 
2170 2180 2190 2200 2210 2220 

ccaaggcaca gaggatggta cttctatgtc acaccacaag agatccaccc cctctatgtg 
2230 2240 2250 2260 2270 2280 

gcccttcaaa tcaaggagga cttgagacat cetccatgtg aagccaggta atgcggcccg 
2290 2300 2310 2320 2330 2340 

tgctagtaag gaagtacatt ccactgaatc cagaagcaag. tgcatgagtg cgtgtatgta 
2350 2360 2370 2380 2390 2400 

cagatgagtg tgtatgtgtg tatttcttgt tttcatttta tattctgatc acctccaaat 
2410 2420 2430 2440 2450 2460 

agactagttc ctggtcaggc ttaatcttta tttatttaac agtatttatt acaacgtatc 
2470 2480 2490 2500 2510 2520 

atgcaaaaag cactgtgttt accactctga agttctgaaa gatatgcatg acttggtatt 
2530 2540 2550 2560 2570 2580 

tactaacatt aattcaatca acagcagatg ctcaacaaat attgggcact tactatgctt 
2590 2600 2610 2620 2630 2640 

actatgtgtc agaactatga taaactaaaa ataaatgcat aaataagcta gactagttcc 
26S0 2660 2670 2680 2690 2700 

tgacttcaag aaagagtcaa tggatggaga tggagttgac aggtacacac agactatcac 
2710 2720 2730 2740 2750 2760 
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cagaggagat ggngagtctt ccagtagaat taggtgtggc aatagcaaca cagggaaaag 

2770 2780 2790 2800 2810 2820 

agaatctaac ttagcctgga tgaggtcaag gaagacttcc cagaggactc caagctaaat 

2830 2840 2850 2860 2S70 2880 

catgtatcat cgacagaccc taaagaaaca acatattttt aagaaaacag gctctcaata 

2890 2900 2910 2920 2930 2940 

aacaaactct taaatggatg taaacaaaac ctcaattttt taaactaaaa attcccttca 

2950 2960 2970 2980 2990 3000 

gttatcacaa agttaaagtc tattttgcaa agacggtaaa atagataagc agccagaccc 

3010 3020 3030 3040 3050 3060 

atctcagggc tgaggcggtt gccatggttt gggt tgctca ggagaagtcc tcggggcatg 

3070 3080 3090 3100 3110 3120 

tgtataggga gaactggaaa aggcaaccag agacagagaa cagaattaaa tccttgacat 

3130 3140 3150 3160 3170 3180 

ctcgscaacc taatttcagc tagagattta gccacacttt tcccacacct agtccactat 

3190 3200 3210 3220 3230 3240 

caccagccac aaccaccggg gctcactgga tcatctggcc cctaccagac ttgccatctt 

3250 3260 3270 3280 3290 3300 

agtctatgag tatgtgaaga ttaaaccatc acagttgaac acagagccct gctgctccta 

3310 3320 3330 3340 3350 3360 

gaggcatgac tctaatcctt tcaacaacta cacaccagcc ctcaggggca gtgaaagaat 

3370 3380 3390 3400 3410 3420 

cctgcctcca ctagttcaaa ctttagacct taaaaaaaac tttttttatc ttaagtcctg 

3430 3440 3450 3460 3470 3480 

ggatacatgt acagaacacg cataggtctg cacatgccat ggtggtttgc tgcacccatc 

3490 3500 3510 3520 3530 3540 

aacccttcat ctagattcta agccccacat gcattaggta tttgtcttaa tgctccccct 

3550 3560 3570 3580 3590 3600 

cccccagccc tccatccccc cgacaggcct tggtgtgtgt tgttcccctt cctgtgtcca 

3610 3620 3630 3640 3650 3660 

tgcgctctca tgattcaac t cctgnnnnnn nnactcatga gtg'agaacac gcagcgttcg 

3670 3680 3690 3700 3710 3720 

gttttctgtt cctgtgtcag tttgctgagg acgatggttt ccagcttcat ccatgccccc 

3730 3740 3750 3760 3770 3780 

gcaaaggaca tgaactcact cttttttatg gctgctagac aacttactca gactcgcctt 

3790 3800 3810 3820 3830 3840 

ttaaaagtgt tcctacttgg atattgagga aaatgcacgg aagtgcccaa agaagtgtgt 

3850 3860 3870 3880 3890 3900 

tgtgcctgct tatttctcac agagtaatgc tgaaanctgt gttgcttttc cccaccaggc 

3910 3920 3930 3940 3950 3960 

cattaccagt accagaagtg cttcctgggt catgagccgg gtctgggatg atggctatcc 

3970 3980 3990 4000 4010 4020 

ttgggatatg atgtatgcta cccgctttgc atcctttctc cggaatgtcc ttccttcatt 

4030 4040 4050 4060 4070 4080 
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catctctgac tggttatatg tccagaagat gaacacgtgg tttaagcatg agaactatgg 
4090 4100 4110 4120 4130 4140 

cctgatgcct ttaaacgggt acttaaaaac ggaaatttnt ttttattcaa aaaagggggg 
4150 4160 4170 4180 4190 4200 

cactcattta atgaatttat tctctctaga acttactttt gttgtctcat tgagcctaga 
4210 4220 4230 4240 4250 4260 

aacattaaac tcaaggtttc acaggtgacg gaatatgccc agagaccacg tatggcttgg 
4270 4280 4290 4300 4310 4320 

aaaacttatt gaaattagtc cagtacagaa agggtatgga aaaatccgaa atggagatga 
4330 4340 43S0 4360 4370 43BO 

cgcaggcaga taaatcaccc tgacatgcat gatgcatttg tggtggctac aagccatagc 
4390 4400 4410 4420 4430 4440 

atagaacttt gaggactgaa caaactcaaa ttggtttttg gaagaacatc ttgtccgtgc 
4450 4460 4470 4480 4490 4500 

ttatgggtgt atgaagacat. caacaataat acctgcttct caagatggtt gtggtattca 
4510 4520 4530 4540 4550 4560 

ataatataaa aatataaaaa ttgctttcta aatgataaag ctttaaaaaa attggttctt 
4570 4560 4590 4600 4610 4620 

cttagtctca attttccua tgtgcttcaa aggagcaaat aacaaaacag tgttaatcaa 
4630 4640 4650 4660 4670 4680 

catgtctcag caagtaggaa gtctcaaaac aaaagtgcac acttcctcca cccctgaaat 
4690 4700 4710 4720 4730 4740 

gttgacattt ttgcagaacc atcaggaggc atggaacaca taaagtaatg gagagtcaca 
4750 4760 4770 4780 4790 4800 

actaacgcgg cctgtaagat tagtcagatt catttattta cctctttata gagacagggc 
4810 4820 4830 4840 4850 4860 

ccaacattta ctaattagga agtcatccca ggtagaagaa tcagcatatc aatagaaaaa 
4870 4880 4890 4900 4910 4920 

aagaatattt aagttggtaa gaaaagaaag aactgagaaa ttttatcccc tggcccatgc 
4930 4940 4950 4960 4970 4980 

tagccaaaaa gtttcattgt gtttagagaa agatggtaag aaaaaggagg aacrgtaaat 
4990 5000 5010 5020 5030 5040 

caaaagagca aatgccagat ttaggagcta aactgtcagt ccaaagcact tatactacca 
5050 5060 5070 5080 5090 5100 

agtcttgcag gctgctataa ccctttaaaa tatgttgatt ttatgcattt aaaattatgc 
5110 5120 5130 5140 5150 5160 

ttaacactgt ggcttgcttg acagLagagg gtgggaggag gaagagaatc agaaaaaaat 
5170 5180 5190 5200 5210 5220 

aettatcagg tactatgctt attacccagg cgacaaaatt acctatacac caaacecctg 
5230 5240 5250 5260 S270 5280 

tgacacacaa tttacttata taacaaacca tggaccccca aacctaaaat aaaagttttt 
5290 5300 5310 5320 5330 5340 

aaaaattatg tttaatatag taagtcccat agcttgagct ggttaagatt ttttatcttg 
5350 5360 5370 5380 5390 , 5400 

taagagtaac tataaattat attttggcct tgccatttag acaattaaaa catagtttta 
5410 5420 5430 5440 5450 5460 
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gaaattcatt cattccgaaa actaagcttc cttttggaaa gggttccaat taccctaagt 

5470 5480 5490 5500 5510 5520 

ttccggaggg agaaaggggg aggaaaaaca ggtttcattg cggtctatgt tttgctacct 

5530 5540 5550 5560 5570 5580 

tgtaaggtaa aagaagaggt tgcaggatta gataaacaga aaatgatgtg gaagtataga 

5590 5600 5610 5620 5630 5640 

gacaagtttc aggactLaca aggtttcttc, gtgtctgaga tacttgcagg aaattccgga 

5650 5660 5670 5680 5690 5700 

atctcaaagg aaacttaaat caaaatgaaa tatatngtcc tgaaaaatat tattcccaga 

5710 5720 5730 5740 5750 5760 

attttggcaa ctaaaatgca atatcaaagt tgttacactt ttttgtggac acagctgatg 

5770 5780 5790 5800 5810 5820 

aaagaaaacc aaacatggca ataaaacttc ccaccactgc aagtctgatt tctccatgta 

5830 5840 5850 5860 5870 5880 

agacaagacg ttaaagttat gataatagtg cacttataac aacagtgcct gcatgtgcca 

5890 5900 5910 5920 5930 5940 

ggaactgttx taagtgcitx aaggataatt gatcatttaa ttttcacaac aacctatgag 

5950 5960 5970 5980 5990 6000 

gaagattcca tcatcatccc cattttacac ataaagaaac aaatacagaa aagtaacaac 

6010 6020 6030 6040 6050 6060 

tagtaagaga tggagctagg ttatgaacct gggccatctg ctxccagagt tggcgttctt 

6070 6080 6090 6100 6110 6120 

aaccacttta gtatgtctac aaattagttt tagtctcatt taggaaagga attgccatga 

6130 6140 6150 6160 6170 6180 

gagaagagag tcagtggcac tcatgctgat gtttaag tgc ttgatgccat ctcaatgtta 

6190 6200 6210 6220 6230 6240 

tgggccgttg caggtatttc ttggaaatga gctatttaca gcaagggtgt ctgcctctca 

6250 6260 6270 6280 6290 6300 

tngctgtagt tccctgagaa aagagcccgt gttcaatgat gagctcccat cccgcatcct 

6310 6320 6330 6340 6350 6360 

gtgtggcact ctgtccatca agcccagtgt gaaggagttc acggaaacct cagctgtgt-C 

6370 6380 6390 6400 6410 6420 

Lgaggatggg accacgtttg aggctatcga ctctgccatc tttgcaacag gctatgatta 

6430 6440 6450 6460 6470 6480 

Ctcctacccc ttccttgatg agaccatcat gaaaagcaga aacaatgagg ttaccttgtt 

6490 6500 6510 6520 6530 6540 

taaaggcatc ttccccccac taatggagaa gccaaccttg gctgtgattg gcttggttca 

6550 6560 6570 6560 6590 6600 

gtcccttgga gctgccatcc ccacagcaga cctgcaagcc tggtgggctg ctaaagcatt 

6610 6620 6630 6640 6650 6660 

tgcaagtagg tgggccattc tgtctttcat tcattttatc aatgaacatt tactgaacac 

6670 6680 6690 6700 6710 6720 

ctgctatatg caaagcactg tgctagggat acaatgagaa caagacaaac atgttccttg 

6730 6740 6750 6760 6770 6780 
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acctctcaag gcrtaaaatg gggtgtgggg gacgccataa caggggaaat ttgggggggt 

6790 6800 6810 6820 6B30 6640 

tct.agt.gagg ggagttggac tgttgcacag agcaaacagt acacaggaag tcataaaggt 

6850 6860 6870 6880 6890 6900 

gagggaaagc atgaaatgtg taaggaccca gaaacatttt ggcggaaggg aatacaaagc 

6910 6920 6930 6940 6950 6960 

agaggcaggg agcggcaaga aatataggtt tataagccac gttaaagagc ttaaacttct 

6970 6980 6990 7000 7010 7020 

catagggatt aaggacttcg caagatttta agcaagaaaa aaatagcaga ggataactgc 

7030 7040 7050 7060 7070 7080 

aatgtcaggc tacattataa agattggaag ggccctggtg agggttggag gtgtgccaga 

7090 7100 7110 7120 7130 7140 

aacctcactg gtgtcaactt ctgtcagaat aacaaagtca ggccactctg attctcatga 

7150 7160 7170 7180 7190 7200 

caatcttctt cttccctccc tctactctag acctcatggt ctccaggggc tacaagcatg 

7210 7220 7230 7240 7250 7260 

cttatgtgag gaaatcaaga atatgaggac tacatggaga aaggcaatgt ctcaaatata 

7270 7280 7290 7300 7310 7320 

ttaatctact ccagtcatac tgaatattat catcattatt gaaaagcgtt cttttattca 

7330 7340 7350 7360 7370 7380 

ggtattctcc aaaatattga ccaatatagg tataacttac ctaacataac taatccataa 

7390 7400 7410 7420 7430 7440 

aaactcacac tattggtaat taacaaacca ttacaatcat ggaatacatg tatatatact 

7450 7460 7470 7480 7490 7500 

gtctaaaact ttgtagataa ataaatttct atttcaaata caccatgaaa gaccatcatt 

7510 7520 7530 7540 7S50 7560 

taaataaacc ccatcatgaa atcttttgta aaggtgctcc ctgcaaaata cttctattgc 

7570 7580 7590 7600 7610 7620 

ctttttcctt cgaaaggcac aacaatgcca agagcctggg gtattatgag aagactggat 

7630 7640 7650 7660 7670 76B0 

atagttcata aacctaagaa atttacatga agcaaatggc. atcatttatc tattcagcaa 

7690 7700 7710 7720 7730 7740 

atacttactg aacacctact atgtgtcagg ctctaacctg gcacttagga cacaacaaca 

7750 7760 7770 7780 7790 7800 

aacgaagcag aacaaaattc tggcctctta ctttctagca gggcgcccag ccaatatcaa 

7810 7820 7830 7040 7850 7860 

tcatagggta ctaccaggtt gacataagac actaacgatg actgggaaat attcatgcac 

7870 7880 7890 7900 7910 7920 

tgcaaatttt agagtaactt tcttccactg ttacaaaggc aaacaagcta ccatcaccag 

7930 7940 7950 7960 7970 7980 



ttaaaagaag ttgcattgat gtagtgaaat tcacaaaaag ctaaaacttg tctgctgccc 
7990 8000 8010 8020 8030 8040 

cttaaaacac cttgcacagt tgcagaagat gtttaaaatc ctatgcctcc ttccatcacc 
8050 8060 8070 8080 8090 8100 
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tcatttaaaa tggcagaaac cttaaaggga actgttttac cagattcttt cttcagagaa 
8110 8120 8130 8140 8150 8160 



gttttaggaa aaggatacag aaaaaaaagg aagaaattat caagctatta tatgcatgaa 
8170 8180 8190 8200 8210 8220 

gtgxactgag cacatatgtt gaggattagg tcctctataa tgttaccgaa ataagagact 
8230 8240 8250 8260 8270 8280 

gagtgatttg aagctacaaa tgtctctgct gtcactatct cactacaggc cagctttgcc 
8290 8300 8310 8320 8330 8340 

acttcccaaa ggctcattaa cttttcagat ccttgtctcc atgaactggt attttgccaa 
8350 6360 8370 8380 8390 8400 



agatatcaaa gacatctcca gctcctctta atacaaaagt tttcaggaat acagtttaca 

8410 8420 6430 8440 . 8450 8460 

aaaaccaaat gacctccatc atatgtcatt acatatctct gatttgtgct tttcaatatt 

8470 8480 8490 8500 8510 8520 



tttctcttca tttcttttct agactcatgt accctgccaa ccacgaatga aacgatggat 
8530 8540 8550 8560 8570 8580 



gacactgatg agaaaatggg gaaaaaactc aagcggtaag cagctaactg tacttgctaa 
8590 8600 8610 8620 8630 8640 



tagagcaagt tcctaaaatg tgcctttatg tgtagaaaaa catcaatatg ctttaatatt 
8650 6660 6670 8680 8690 8700 

gtcattagtc agagttcaca ttttctgaac acttgcaata atcaaaaaac gtttagatag 
8710 8720 8730 8740 8750 8760 



taaacagtca tcacacttct cttgtgtaac tcaagaatag aggttttcta tcagggataa 

8770 8780 8790 8800 8810 8820 

ttttgccctc caggtgacat atggcaaaat ctggagacac ttttggtcac tgtgagtgga 

8830 8840 8850 8860 8870 8880 

gagggcacgc tatcagcatc ttatgagtag agaacaggga ttctgctaac catccaacaa 

8890 8900 8910 8920 8930 8940 



tgcagagcac agttcaecaa aacaattatc tggctcaaaa tgtcaatagt gctgaggtta 
8950 8960 8970 8980 8990 9000 

agaaacaact ctataaatga ctacagttga cctttgaaca acacaggttt gaactatatg 
9010 9020 9030 9040 9050 9060 

ggcccactta tacatggatn ttttcaatta acataantcc agactgggca tggtggctca 
9070 9080 9090 9100 9110 9120 

cgcctgtaat cccagcactt tgtgaggctg agacgggcgg anaaactgag gtcaggagtt 
9130 9140 9150 9160 9170 9180 

cgagaccagt ctggccaaca tggcaaaacc ctgcctctac Laaaaataca aaaaaaaua 
9190 9200 9210 9220 9230 9240 

gccgagtgtg gtggngtgca cctgtaatcc cagctactcg ggaggccgag gcaggggaat 
9250 9260 9270 9280 9290 9300 

tgcttgaatc agggaggtgg aggttgcagt gagccaagat cgcgccactg cactctagcc 
9310 9320 9330 9340 9350 9360 

taggtgacag agtgagactc catctcacaa aaaaaaaaaa aaaaa 
9370 9380 9390 9400 
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aaaaaaaaaa aaaaaaaaag ccacaaaggc cacttattaa caaggagcag aagtgagcae 

10 20 30 40 _ 50 60 - 



caagattagg caggaannaa taagctaact actgttttgt gcaaacgcag tcagatttat 

70 80 90 100 110 120 

gatcaggatg gcccctaccc atgaagctac cccctcaaac ctcgaaggga aaagatgaat 

130 140 150 160 170 180 

atcagcttcc tatcttttgg ttatacaaga ccctttttct ggattagctc tgtcaatgct 

190 200 210 220 230 240 

ttgtccctga agtcagaaag tccttgccaa taagagactg ccttttaaag ttcttttgat 

250 260 270 280 290 300 

atagacaatg cccctgacca cccagaaccc catgagttca acatggaagg catcgaagta 

310- 320 330 340 350 360 

gtctaatttc ccccaaacac aacattctaa ttcagccttt atatcaggga gtcataagga 

370 380 390 400 410 420 

cctttaaggc tcatcacata ccatactcta tggaaaagat agccaatgct gtggaagata 

430 440 450 460 470 480 

acccaacaga gagaacatca cgaaagtctg gaaggattat accattgaag acgccctaat 

490 500 510 520 530 540 

tgctatagaa aaagccatga aagccatcaa tcctaaaaca acatatttct cctggagaaa 

550 560 570 580 590 600 

actatgtcca gatgttatat atgacttcag aggatttaca acagaccagt cacagaaatc 

610 620 630 640 650 660 

atgaaaaaga ttatggatat ggcaaaataa aaaggtgagg gtgaagggtt tcaagatacg 

670 680 690 700 710 720 

gatcatggag aaattcaaca gctaatagac accaccaata gacactttta attccacact 

730 740 750 760 770 780 

agaggaacta aaagatgact tgatggagat gagtccttcc aaagcagtgc cagatgagaa 

790 800 810 820 830 640 

cgaagacata gaaaaagcca tgccagaaat aaattgacat tagatcatct ggcagacagg 

850 860 870 880 690 900 

ctccagttat tcaagacttc ttttgacttc ttttatataa catggaccct tCLatgatac 

910 920 930 940 950 960 

aggcactgaa actaaagcaa atgatagagg aaggattact accacataga aaatttctag 

970 980 990 1000 1010 1020 

agaaacaaaa aagcaaagtc agacagaaat tacaacatat ttccataatt acaccaatgg 

1030 1040 1050 1060 1070 1080 

gcctgccccc cetgccccca attctacctc ctccatctct tccgcttctg ccaggcctga 

1090 .1100 1110 1120 1130 1140 

aacagcaaga ccaacccctt ctgtttctcc tcccactcct cagcctactc aacataaaga 

1150 1160 1170 1180 1190 1200 

tgataaggat gaagacattt atgataaacc acttccactt aatgaatagt aaacacattc 

1210 1220 1230 1240 12S0 1260 

tttcctcctc ataattttct taataacatt ttcctttctc catatxactt tattgcaaga 

1270 1280 1290 1300 1310 1320 

atagtactta atacgtatga catacaaaac atgtgttaac caactgtttg cattattggt 

1330 1340 1350 1360 1370 1380 

aaggcttcca gtcaacaggt tattaagagt taagtatttg gggagccaaa agttatacat 

1390 1400 1410 1420 1430 1440 

ggatttttga ctgcaagagg gctcaatgcc cctaacccct cagttcttcc aaagtcaact 

14S0 1460 1470 1480 ,1490 1500 
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gatataggaa gtttctttac tttttcaagc atttaacatt gcattgatat gtcaacctaa 
1510 1520 1530 1540 . 1550 1550 

aggaaaacac tgaggcaaat ttaatataaa aagagaattg atttgggcca agtttgagga 
1570 1580 1590 1600 1610 1620 

ctgcaaccca ggagcacaga gccaaattgc cctgaatatg cactccgttg gcagcagtta 
1630 1640 1650 1660 1670 1680 

caagtaggtt ttttaaagga aatacaaaag agtcaacttc taagttgttt accaagaact 
1690 1700 1710 1720 1730 1740 

tacattaaaa ttatataagc tattgattgg ctatatactg ttcttcgtat cacaaattct 
1750 1760 1770 1780 1790 1800 

acgaacatga agatgatgag tgagacagct agtcaggaat aaaaatgcct tttaacaatt 
1810 1820 1830 1840 1850 i860 

gccgccaggc ttggtagagg gcagcatgac aagtcccata cacgtggctc tctcagcttg 
1870 1B80 1890 1900 1910 1920 

ataaattttg catacctcac atagtgcaaa ctactctgag ccatttttct tctctcacat 
1930 1940 1950 1960 1970 1980 

tgaatgccac aatgtagcca cccattcagg gcctagagaa gaaaagaaac ggaaccctca 
1990 2000 2010 2020 2030 2040 

gattcaacaa aacctctcct gcacaacttc agccagttga cgaacaactt gcagagttgg 
2050 2060 2070 2080 2090 2100 

gcactttcat gtgctaacaa ttcatgcagc ttgataccct ttcctttaga gcccagtaga 
2110 2120 2130 2140 2150 2160 

aataaaaatg aggaaataga gaggttaaaa tgttcatctt attcjcttaaa tgataagctg 
2170 21BO 2190 2200 2210 2220 

Ctcttcagag tttcaaaaag caaattacac catattccaa ctaaaagaac tatagaggcg 
2230 2240 2250 2260 2270 2280 

gaaaggaggt gatctctttt ctctctgtca taaaaggtaa tggccaacac ccctataaca 
2290 2300 2310 2320 2330 2340 

aaagacaggt taacaagaga aaacgtgaca gatttattac gtgcacatgt gcgcatgaga 
2350 2360 2370 2380 2390 2400 

gccttacaaa acatgaactc aaaggagggc cagatcattc atgtttaaat accctcttca 
2410 2420 2430 2440 2450 2460 

ctggggttag gggagatgga agtgtaaaag taaacgattt ttcagaggaa ac.taac.aagc. 

2470 2480 2490 2500 2510 2520 

ccaaagaaca cagattagac caagtttctc tgggctttgg gggaggtgta atcacccaac 
2530 2540 2550 2560 2570 2580 

agattcatct tgctcactgc ccagaaaagc tgatgccctg agaacagcag gtttttccaa 
2590 2600 2610 2620 2630 2640 

tagagagagt ttaataaaca cacagctgtc agaggcattt gaaccagagt gactccatct 
2650 2660 2670 2680 2690 2700 

tgaatagggg ctgggtaaaa tgaggctgag acccactagg ctgcattccc aggaggttag 
2710 2720 2730 2740 2750 2760 

gcattcttag tcacaggatg agaaaagagg ccagcaeaag atccaggtca caaagacctg 
2770 2780 2790 2800 2810 2820 

gct.gat.aaaa caggattcag taacgaagct ggccaaaacc caccaaaacc aagatgatga 
2830 2840 2850 2860 2870 2880 

aaaaagtgac ctctggtcgt cctcactact cattatatgc tgattataat gaactagcat 
2890 2900 2910 2920 2930 2940 

gctagaagac actcccacca gcactgtgat agtttacaaa tgccatggca atatcaggaa 
2950 2960 2970 2980 2990 3000 
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attaccctat atagtctaaa aaggggagga accctcagtt ctgggaactg cccatttctt 
3010 3020 3030 3040 3050 3060 

ccctgtaaaa cttatgaata atccacccct tgtttaacat gtaatcaaga agtaactata 
3070 3080 3090 3100 3110 3120 

agtatactca gttgagcagc ccatgccact gctctgccta tgaagtagcc attcttttat 
3130 3140 3150 3160 3170 3180 

ccctttactr tcttaataaa ctcgctttca ctttatggac tggccctgaa ttctttcttg 
3190 3200 3210 3220 3230 3240 

tgagaggtcc aagaaccctc ttttggggcc tggccagcta aacggaagga caggagttta 
3250 3260 3270 3280 3290 3300 

ttactactca aatcagcctc catgaaaatt cagaggctag atttttttaa ggatagtttg 
3310 3320 3330 3340 3350 3360 

gtagtcaggg gctagggaat ggggaatgct gattggttgg gccagggatg aaaccatagg 
3370 3380 3390 3400 3410 3420 

gagtcaaagc ttgtcttc tg gtcttcctgg gaggagacca catgacaaga egaaccagtt 
3430 3440 3450 3460 3470 3480 

taccagtctg ggtagtgcca gccggcccat cagaatgcag ggtctgaaaa atatcttgag 
3490 3500 3510 3520 3530 3540 

caccaatggt aggttttata atggtgatgt tatccatagg agcaattggg gacttctgac 
3550 3560 3570 3580 3590 3600 

cgcatgaccc ctgagcccta atttcttatc ttgtggctaa tttgttagtt ctacaaaagc 
3610 3620 3630 3640 3650 3660 

agcctgatcc ccaagcaagg agggggtttg ttttgggaaa gggctgttac catctttgtt 
3670 3680 3690 3700 3710 3720 

tcaaagttaa actgtaaact aaatgtctcc catagttagc ttggcctatg ctcaggaacg 
3730 3740 3750 3760 3770 3780 

aataatggca gcttggagat tagaagaaag atggagtaat tacatttttc tttcacattt 
3790 3800 3810 3820 3830 3840 

ttttcactgt cacaattctt tcaaaggtga tttcagaggt aacatcacag gacatgggag 
3850 3860 3870 3680 3890 3900 

actaaaggga ggaaagtatg tcaaacaaag gctgtcctgt tctgcagacg aaacctcaca 
3910 3920 3930 3940 3950 3960 

gaaagcaact ctcagagtca gtagcctatg acgaaagttt ctctgtcaga cattcagcag 
3970 3980 3990 4000 4010 4020 

tgcccgactc tcagtctctc tctcctgcaa gttaatcttt cctagagtgg gcaagggagg 
4030 4040 4050 4060 4070 4080 

cctccgagaa agcctagttc ccatcttctg tttacttcct tttattttct ccacagataa 
4090 4100 4110 4120 4130 4140 

aaatctcctt cacaaaaggc agettttcag ggctgtttct gtctgcaggc cctcrgaata 
4150 4160 4170 4180 4190 4200 

gccatctcaa aatctgtcaa cgaagtgtat attttgcagt aaaatatttt ttgtttcctt 
4210 4220 4230 4240 4250 4260 

tagtatgaaa caatttatat tattagatta caggagtatt aaaaccatcc atgatctcac 
4270 4280 4290 4300 4310 4320 

ttttaaacaa accaacctga aagtctaaca ttggggcaga ctctaagcaa tgtcttataa 
4330 4340 4350 4360 4370 4380 

agaataatta tgtgttaatg agtaaactaa gttaattagt ctccttaaac cagagggtca 
4390 4400 4410 4420 4430 4440 

gtttactcca ggccacatgg tcaaaggcaa aagtccaaca ttacatcaaa ctcaaataga 
4450 4460 4470 4480 4490 4500 



FEUILLE DE REMPLACEMENT (REGLE 26) 



3DOCID: <WO 982491 4A1_1_> 



PCT/FR97/02226 

WO 98/24914 



48/53 



f racpment4 . FMOx 



gattaggaag gaggagaaaa gcagctcact tagctaaaga aaaaacaata aattcaactt 

4510 4520 4530 4540 4550 4560 

tgtggaaaag gagggcataa atggaggcgc tatctaaaat gttacttttc cgaaagaaaa 

4570 4580 4590 4600 4610 4620 

aataagaaat taatgctcct atttgcaact gtaacactta ttccagtatg ttctcttctt 

4630 4640 4650 4660 4670 4680 

tcttcatgxt tggccagagc cagactttgc agacagatta catcacatat gtggatgagc 

4690 4700 4710 4720 4730 4740 

cgggctcttt cataggggcc aagcctaaca taccatggct cttcctgaca gacccccgcc 

4750 4760 4770 4780 4790 4800 

tggccctgga ggtgtacttt ggccctcgca gcccatacca gtttcgactg acgggaccag 

4810 4820 4830 4840 4850 4860 

ggaagtggga tggggccaga aatgccatcc tgacccagtg gaaccggaca gcgaagccaa 

4870 4880 4890 4900 4910 4920 

ccaggacaag agttgtcagt gaagttcagc gaccccatcc cctttacaat ttgcttaaaa 

4930 4940 4950 4960 4970 4980 

tgctttcatt cccattactc cttctggctg ttacacttac attttattaa tgagaaagtc 

4990 5000 5010 5020 5030 5040 

tctgaggtct caaaattcag catagaagtg taaccacaca atacaacaca caccacacat 

5050 5060 5070 5080 5090 5100 

acacacacac aatcacaaca tagctcctc: ctcccttcct gaagatatga aaatcagtct 

5110 5120 5130 5140 5150 5160 

tggcccattt gaattaaagt ataagtaaaa tggaaaatac Lcagcccctc tctccccgtt 

5170 5180 5190 5200 5210 5220 

gggaatctgt cctctaaaag gcttttcaca tgctgaattg gcaaacttgg ggatgcttaa 

5230 5240 5250 5260 5270 5280 

gataagacag gaagttgaat aagcatgagc acagatcttc aggctgaaca aagtttaaca 

5290 5300 5310 5320 5330 5340 

aaatgtaaag gcattttatt ttgtccatta tagtatatta accaatgtac tcttcacatt 

5350 5360 5370 5380 5390 5400 

aaccgaagtc attgacatca aatcaacata gagagacaag tttataccaa tacaacaacg 

5410 5420 5430 5440 5450 5460 

aagataaaat gaacacaccg cttgaaagat acatactgcc aaagctctcc caagaagaag 

5470 5480 5490 5500 5510 5520 

catataacct gaatagatcc aaatctatta aagtacttga atttgcagtt taaaaactct 

5530 5540 5550 5560 5570 5580 

tccacaaaga acaggccaag aaccaggtct tcactggtta attctgtcaa acatttgaga 

5590 5600 5610 5620 5630 5640 

aagcaatata ccaactatat gcaaaatttt ccagaagatt aaagaggaca gaataatect 

5650 5660 5670 5680 5690 5700 

cagcucatca tagccctgac acctaaacaa gacaaacaca tcctaaaaaa ataaaatata 

5710 5720 5730 5740 5750 5760 

gatcaatatc cttcatgaag atatatgcaa aaattcttaa caaatgttaa tataatcaaa 

5770 5780 5790 5800 5810 5820 

cagtrtataa aatgaatagc ataaccaagt aagaattatt ctggaaaagc aatgttggtt 

5830 5840 5850 5860 5870 5880 

taatagtcaa tgtaattcac cacatttgta aactaaaaat gaaaaaccat aggatcatct 

5B90 5900 5910 5920 5930 5940 

caatagatgc ataaaaagca tctgacaaaa gccaacatcc actcctgaag aaaactctca 

5950 5960 5970 5980 , 5990 6000 
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acaaagtgat agaaggaaac ttcctcaaca tgaaaaaggg catctatgaa aaacctacag 
6010 6020 6030 6040 6050 6060 



ctaatatcat actgaatggt ggaaaactaa acgctgtatt tctaagagca ggaacaatat 
6070 6080 6090 6100 6110 6120 

aaaggccttg gctctcacca cttctagtca acatcctact ggggtttcta gccagtgcaa 
6130 6140 6150 6160 6170 6180 

taaggaaaaa gaaagaggaa taaaagatat caaaagtgga atgggagaag tagaaccttc 
6190 6200 6210 6220 6230 6240 

tttattctta gacaacataa ttgtctatac agaaattatt ttgaaatcta cataaaaatt 
6250 6260 6270 6280 6290 630C 

acagaacaaa taattatatt tctatatact aacagtaaac agtagaaaat tagaaaattg 
6310 6320 6330 6340 6350 6360 

taaactatta tttataacat ccaaaaatat gaaatattta ggataagcca gcataagaaa 

6370 '6380 6390 6400 6410 6420 

ggtaaaaacc atacactgaa agctaaaaaa catagctgag agtaattaaa ggtctaaata 
6430 6440 6450 6460 6470 6480 

aatggagaga tacactatat ccc.gggtt.ga accaccgata ttgtggtgat gtcaattatc 
6490 6500 6510 6520 6530 6540 

ctcaagctga tccataattt caatgcaata ctaatcaacc ccctaacatg cttttttata 
6550 6560 6570 6580 6590 6600 

gaaattgaaa actgatxcta aaatgtataa ggtatxtaaa ggacctagaa ttgttaaaaa 
6610 6620 6630 6640 6650 6660 

ataactttga aaaggccggg cacaaaggct cacgccagta atcccagtat ttcgggaagc 
6670 6680 6690 6700 6710 6720 

tgaggcaggc ggatcacctg aggtcaggag ttcgagacca gcctggccaa catggagaaa 
6730 6740 6750 6760 6770 6780 

ccccatctct actaaaaata caaaattagc cagacgtggt ggtgcatgcc tgtaatccca 
6790 6800 6810 6820 6830 6840 

gccactcggg aggctgagac aggagaatcg cttgaggcgg aggttgcagt gagccgagat 
6850 6860 6870 6880 6890 6900 

tgcgccactg caccccagcc tgggcaacaa gagccaaact ccatttcaaa agaaaaaaca 
6910 6920 6930 6940 6950 6960 

aatgtggagc attaacacta cctgacttct gatttcagaa tttcttattt tatgaagcta 
6970 6980 6990 7000 7010 7020 

cagtaatcaa gtcagtatgt tatggtgtga agataaacaa taggtcaata aaaaagaacg 
7030 7040 7050 7060 7070 7080 

gaatgtctgg aaatagaacc acacaatatg gacaaaggtg aaaattcagc aaagacagga 
7090 7100 7110 7120 7130 1140 

gagtcttttc aacaaatgat gttggaacca ttggatatca tgcaatatgg aaaaaaaaaa 
7150 7160 7170 7180 7190 7200 

ccttcagtca atactttgta ctatatacaa aaagtaactg aaagaggatt atagaaccaa 
7210 7220 7230 7240 7250 7260 

aaccccaaaa cttctagcag aaaatgaaaa agaaaatctt tgggttaggc aaaaatgtct 
7270 7280 7290 7300 7310 7320 

tagatacaat actaaatgca caatattcat ttttaaaatt gtgtaaattg aacttcatca 
7330 7340 7350 7360 7370 7380 

aaattaagaa cagttctagc atattctcac tcacaggtgg gaattgaaca atgagatcac 
7390 7400 7410 7420 7430 7440 

atggacacag gaaggggaat atcacactct ggggactgtt gtggggtagg ggtagggtgg 



7450 



7460 




7490 



7500 
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agggatagca ttgggagata tacctaatgc taaatgacga gttagtggtg caqcgcacca 
7510 7520 7530 7540 7550 7560 

gcatgacaca tgtatacaca tgcaactaac ctgcataatg tgcacatgta ccctaaaact 
7570 7580 7590 7600 " 7610 7620 

taaagtataa taaaaaaaaa gaacagttct aatattcctt taggaaagaa tacagtaagt 
7630 7640 7650 7660 7670 7680 

acattgatac ttatgacatc cacattattt gtatctaata aaagcaggat gaatattctg 
7690 7700 7710 7720 7730 7740 

actcaatttg tctaactgga gagatggata agtcatagta gaaaaagttc agacttgaaa 
7750 7760 7770 7780 7790 7800 

agaaaaatgt ataccaaact atctcaactt gtttttagaa tatgtataat ttatccragt 
7810 7820 7830 7840 7850 7860 

aatcaaaatt ggttcaaacc agatgtgtct ccaaagtatt cttgtgcaca tgtgtatgtg 
7870 7880 7890 7900 7910 7920 

tacacacatg ctagtgttgt gttgtgLtta gtatgatgct agattgtgta acagaaagag 
7930 7940 7950 7960 7970 7980 

tctgtaagaa tcataagctg atcttccaaa taccctatgc acatatttct gagtcccctg 
7990 8000 8010 8020 8030 8040 

ttcaatctgg ggaccaccaa tgaagactaa tctggaatct tggagagaga cacctgggaa 
8050 8060 8070 8C80 8090 6100 

gaacaagaaa aataatattt tgagtggggg tctcttttct ggaacatgtt tcagggtgtg 
8110 8120 8130 8140 8150 8160 

agaaccccac tccctcctca gacctagtac tagagggatg ttcccctcaa caaagactgt 
8170 8180 8190 8200 8210 8220 

agcgaaagtt ggctaaacgg actgctgagc ccttcagact tagcttatct gagccaacta 
8230 6240 8250 8260 8270 8280 

gaaacttttt tgtaatxcag acttcttgat attttattca atcatatgga taatatcaat 
8290 8300 8310 8320 8330 8340 

ttgcactaaa ttaaacttga tggaatgtcg ctcataacct ctgcgtatct ggtcctgtgt 
8350 8360 8370 8380 8390 8400 

agtaagtaga cataagtgtg gtccttccca ccatctttac caaccatgca aaacaaagcg 
8410 8420 8430 8440 8450 8460 

agaacaaaga gccgttaagg agtgacaaaa ggcgagggag catgctaact caaagccaac 
8470 8480 8490 8500 8510 8520 

tcatgcacct cattccaccg attgggtagc ctgctcatct gtgaaatcta tgtttgtgtg 
8530 8540 8550 8560 8570 8560 

tatatacaat ctgtaattga atctagtgta aggactacac cagacaaatt cattaataaa 
8590 8600 8610 8620 8630 8640 

ctaactaaat aaaacccttt taccagttga ttcccaaaga caatcagctt ttcagtcaga 
8650 8660 8670 8680 8690 8700 

ttaatagcaa atctcacagt taagaaacta ctatgttttg catcatcaga cacagaagaa 
8710 8720 8730 8740 8750 8760 

accatatttt taatgtttta ctttgcctct aaaatcctag cataaattag catattttta 
8770 8780 8790 B800 8810 8820 

aaaaagggtt aagagcagta gtttatgcct ggaatcccag cattttagga ggcccaggca 
8830 8640 8850 8860 8870 8880 

caaagattgc ttaagcacag gagtttgaga ccagcctaag caacatagca aaaccttgtc 
8690 6900 8910 6920 8930 8940 

ctacaaaaaa attaaaatta aaaaattagc caggtgctat gactcagatg tgtgtcccct 
8950 8960 8970 8980 8990 9000 
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ccaaat'ctca tgttgaaatg tgatccccag tgttggaagt ggggccttgt gggaagtgat 

9010 9020 9030 9040 9050 9060 

tctctcataa atggcttggt gccctcccca gggtaacgag tgagttctca ctctattagt 

9070 9080 9090 9100 9110 9120 

tcacgagagc tattatagtt gtttaaaaga gactggcacc tcctctcctc tctcttgctt 

9130 9140 9150 9160 9170 9180 

caattctcgt gctccctttc acaccatgtg acatgcctgc tcccccttca ccttctgcca 

9190 9200 9210 9220 9230 9240 

tgattgcaag catcttgagg cctcaccaga aacagatgtc ggcaccatgc ttcttgtact 

9250 9260 9270 9280 9290 9300 



gtctgcagaa tgatgaacca aaataaacct cttttcttta taaattaccc agtctcaggt 
9310 9320 9330 9340 9350 9360 

atttctttat agcaacacaa aacgtgtaac tggcaaaagg gtcctgctgc ttgccacttt 
9370 9380 9390 9400 9410 9420 

tagaaagatg ccaacataac aagagcgaga tgtgacagag aaagagtgag ttttatcatc 
9430 9440 9450 9460 9470 9480 

tgtgttagca aggaaaagag tgggcagaat tcrttcccaa aacttccact cttcaat ttg 
9490 9500 9510 9520 9530 9540 

tgggaggaac acagggtttt cnttttaaga gacaggggcc tggaatgcag gagaggaaaa 
9550 9560 9570 9580 9590 9600 

gggcagctac acagatcaaa aggcaggccc ttagacatgg caccttgctc tgtatacacc 
9610 9620 9630 9640 9650 9660 

agtctcttta aggatataaa ccacaatctg gtttatacac tatgttgatg attataatac 
9670 9680 9690 9700 9710 9720 

attgataatt aacaactgta tatctggatg cagtgtcata atatggcttt ttagtaaaaa 
9730 9740 9750 9760 9770 9780 

gtacttgaag gtaaaatgaa taattagatt aaaaaacgaa gccacaagga aatgatagct 
9790 9800 9810 9820 9830 9840 



gaaatctaag ccacaaggaa atgatagctg aaacttctac gcgtaccttt aaaacttaca 
9850 9860 9870 9880 9890 9900 



cctcacactg aaccgcagtg atctaggtgc cttcaactgc cctgtcccta gacctaataa 

9910 9920 9930 9940 9950 9960 

ggtgtagata gcttcacaga ttaccttttc ttacaataaa agaagtataa ccagagcctt 

9970 9980 9990 10000 10010 10020 

tatgactaca tttgttaatt tctcctctct gaaataagac aatgtaatct tcaggtactt 

10030 10040 10050 10060 10070 10080 

ggtttactaa tatatcacag attcatcacc accccaccca actaatcatc aaatgagttt 

10090 10100 10110 10120 10130 10140 

cgcagctaag aactgactca tattctatac ctgccttctt aatgtattaa gaaaatcctt 

10150 10160 10170 10180 10190 10200 

aagctccatt aggctttggc caatatgaga catccaaatc cagatacttb tgggactaga 

10210 10220 10230 10240 10250 10260 

ctgaaaaaat aagtgagtaa agcagataga ttgcatatta atcattctgc tggcacatca 

10270 10280 10290 10300 103.10 10320 

aacaaagaga aatcatcctt tacttccgca aaaatatttg caggcccagg acaaccagat 

10330 10340 10350 10360 10370 10380 

tttctaaact ttttagagaa gccttgtatt gatatttcca tctgttattt tctggatttt 

10390 10400 10410 10420 10430 10440 

taatgtttag caacaacttt taaaaaaaga tttgtaggcc ttagatgggc tggagaaaac 

10450 10460 10470 10480 10490 10500 
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tcagtaaggg cagatttcag ccgaagaacc tccacttctc ctcaccttct ctggaaacaa 
10510 10520 10530 10540 10550 10560 

tatgtattgc catcttccag ccaccattct cagggttcag agggagttta aaggtctccc 
10570 10580 10590 10600 10610 10620 

aactcaaccc tcggttgata cttgtgttct ttctacaata tccagcctcc tctntaacac 
10630 10640 10650 10660 10670 10680 

ccccttggac acaaaattca ttcattaccc tctggagcag ccttcagata actgactgcc 
10690 10700 10710 10720 10730 10740 

tctggcattt acccagtaca gccaccattc actcacagtg gcgaacacca gccctgtgag 
10750 10760 10770 L0780 10790 10800 

atagaaagag gctcaaatgg gggagtcaca gctacctgct caaaaactca aagcaaaaca 
10810 10820 10830 10840 10850 10860 

ctgaactgac tccaaacagg agtcttcata acttattaga atatttaaaa aggaataact 
10870 10880 10890 10900 10910 10920 

atttccagga atctgttata tggatatttt tgcattaaag cacaaagatg gatgaacaag 
10930 10940 10950 10960 10970 10980 

gaaaatcatt gcagtctcgt ttataatcat gaaaacctgg aaacaattca aatatctata 
10990 11000 11010 11020 11030 11040 

atagtataaa acaacataca gcaaaatata ggagatcaac gtatatatac tgacacggaa 
11050 11060 11070 11080 11090 11100 

ctcttttcaa aatatattgt ttaatgaaaa aagcaagtaa caaagtaaac aatatttctt 
11110 11120 11130 11140 11150 11160 

catttatgta aagtctagta tctgtgtata taaatgttat ttttacacag aaggaaatgt 
11170 11180 11190 11200 11210 11220 

ctgaaagcca actgtcatca gtagctttct ctgaagatta gactggggct ggaaatggga 
11230 11240 11250 11260 11270 11280 

ggaaggagta ggaaccgcac ttttgtttct acatactttc gcattgtttg agcttcttca 
11290 11300 11310 11320 11330 11340 

ttgaagacat t:ccacacac gactcgtttt acacgcaaga aaataatttc ttaaataggt 
11350 11360 11370 11380 11390 11400 

accatctagt ccagaaagca cctacaagac gcctgactgg tgaaccttgc gaagacaaga 
11410 11420 11430 11440 11450 11460 

gaaaaatgaa agattttgtg tatgaatttt agtctcaact gcaaaatatc t tcctgcct t 
11470 11480 11490 11500 11S10 11520 

ctcaatgaca ccacttggtc ctgtgtgcca tgtcaccact ccctgtgttc agatgactgc 
11530 11540 11550 11560 11570 11580 

gtttgtgcat tatataacaa tatxaattgt gctattgcca gagagggctg tgaccaatga 
11590 11600 11610 11620 11630 11640 

ggtacatact aactagaatg cactttacca gaatacacag ttgtggataa gccaacaaaa 
11650 11660 11670 11680 11690 11700 

ggttgagcgc aggttgtgaa cttctcctta cctttcctga aaacaacatg aattgtcatc 
11710 11720 11730 11740 11750 11760 

ttccagtcac cattctcaaa gttcaaaggg agttcaaaga tcccagccgc tttgccctgc 
11770 11780 11790 11800 11810 11820 

acatgagaaa gggaagaata atggaatcgc aaaagtcccc aggtaatgca tgtaattttt 
11830 11840 11850 11860 11870 11880 

tcataatgca tcacccagat caatgctgag atctggaaag agaggaccat aggttgtgat 
11890 11900 11910 11920 11930 11940 

aatgtcctgc cacttcccca tctatcctca actctgctgc aagtctggcc atagcacgcc 
11950 11960 11970 11980 11990 12000 
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ctgctcaaaa tccttcaaag gcttctcatc accttttgga taatgcccaa gctcaagagc 

12010 12020 12030 12040 12050 12060 

aaatgaggcc ctctaccatc tggctctact ctttctcatt tttacctctt ccttgctccc 

12070 12080 12090 12100 12110 12120 

tcttaatact ctggtagtat tggactggtg atatttccta aactcatacc ataatgatcc 

12130 12140 12150 12160 12170 12180 

tcacctcttt gctccaattc ctgctgttcc cctggtcaca gataccttcc atcaccccac 

12190 12200 12210 12220 12230 12240 

acacatctct accaccatag ccttgggcaa ctcctgctct ttgttattta tctttattcc 

12250 12260 12270 12280 12290 12300 

ttctgcacag tggcttttcc tggggaccac tgtcttcatt cctctttgcc catacctatc 

12310 12320 12330 12340 12350 12360 

cttacatata catgttgaaa tgattactac agtcaaggca attaatatat ccatcatctc 

12370 12380 12390 12400 12410 12420 

acccttccct aattggtgtg tgtgtgtatg gtaagagcac caaaaatcta ctctcttagc 

12430 12440 12450 12460 12470 12480 

aaatttctag tatacaatac aatgacatcc gcaagaggca ggcaaacgcc taggcagaca 

12490 12500 12510 12520 12530 12540 

ggggcaggtc cctggtgaaa ccccaccttc aagccaaaga cagtttaaag cctgaaagcc 

12550 12560 12570 12580 12590 12600 

aagctacaag tcaaatccac agactggatt gagaacctct cctcccattc ggtgcacttt 

12610 12620 12630 12640 126S0 12660 

cctctgaatg atccctaccc ttcacctatt ttatatatac ctacccttcc caaattggtt 

12670 12680 12690 12700 12710 12720 

ttttacactg ccatgcccac tgagttgtgc ctttgtttta accttttctg cgtactcaca 

12730 12740 12750 12760 12770 12780 

aaccaatcac caccccccca ttctgagccc ataaaagccc cggacccagc cacactgaag 

12790 12800 12810 12820 12830 12840 

gggagaccac ccaacttcat gtggtggatc accctcatgg cccctctttg ctgagagctg 

12850 12860 12870 12880 12890 12900 

ttctgtcact taataaagct cttctctgcc cttctcaccc ttcaatcgtc agtgtaacct 

12910 12920 12930 12940 12950 12960 

cacttccctt ggattcagga caagaacaca agaattgctg aacataggta tgagctgtaa 

12970 12980 12990 13000 13010 13020 

cacaggcggg ctggggcact cctgggccag tcatggggtg agctagtgtg caaatgggca 

13030 13040 13050 13060 13070 13080 

gagtacctcc tgcagcaggc ctggggctga gcaaggccca gtttggggca tcgccagcca 

13090 13100 13110 13120 13130 13140 

gacacttcca gctggcaaaa gtgacagaaa aatcctgtat cagcaacact attaactata 

13150 13160 13170 13180 13190 13200 

gtccacatgc tgcatatcag acctctagat ttattcatct gacaaaactg caactttgtt 

13210 13220 13230 13240 13250 13260 

tcctttttat ctacatctcc tgatctcccc ctacctctgg taaccacctt tctactctgt 

13270 13280 13290 13300 13310 13320 

ttatgtgtat tcagcatttt ttaagatgct gcatataaga aagatgtgga atactttttt 

13330 13340 13350 13360 13370 13380 

tttcctgtgg cttatttcac ttagcgtaat gtcctctagg atcatcatgt tgcaaatagc 

13390 13400 13410 13420 13430 13440 

aggatctcct tcctttctaa ggctgaataa tattcgtgtg tgtgtgtgtg tgtgtgtgtg 

13450 13460 13470 13480 13490 13500 

tgtgtgtgtg tgtgtgt faq^tSlA JO ( % M ) 
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